loading…
Search for a command to run...
loading…
MCP server for converting various file formats (PDF, DOCX, images, audio, etc.) to Markdown using Microsoft MarkItDown, with support for large files and Cyrilli
MCP server for converting various file formats (PDF, DOCX, images, audio, etc.) to Markdown using Microsoft MarkItDown, with support for large files and Cyrillic text.
GitHub License: MIT PyPI version
MCP сервер для конвертации файлов в Markdown с использованием библиотеки MarkItDown от Microsoft.
| Категория | Форматы |
|---|---|
| Документы | PDF, DOCX, DOC, PPTX, PPT, XLSX, XLS |
| Веб | HTML, HTM, XML, URL |
| Данные | CSV, JSON |
| Текст | MD, RST, TXT |
| Изображения (OCR) | PNG, JPG, JPEG, GIF, BMP, TIFF, WEBP |
| Аудио (транскрипция) | MP3, WAV, M4A, OGG, FLAC |
| Архивы | ZIP |
| Электронные книги | EPUB |
⚠️ Для OCR изображений требуется установка Tesseract. Для транскрипции аудио требуется поддержка в системе.
# Установка через pip
pip install flexberry-markitdown-mcp
# Установка с зависимостями для разработки
pip install flexberry-markitdown-mcp[dev]
# Клонируйте репозиторий
git clone https://github.com/Flexberry/flexberry-markitdown-mcp.git
cd flexberry-markitdown-mcp
# Создайте виртуальное окружение (опционально, но рекомендуется)
python -m venv .venv
# Активируйте виртуальное окружение
# Linux/macOS:
source .venv/bin/activate
# Windows:
.venv\Scripts\activate
# Установите зависимости
pip install -e .
chmod +x install.sh
./install.sh
install.bat
Добавьте в настройки RooCode (файл mcp_settings.json или через интерфейс):
{
"mcpServers": {
"flexberry-markitdown": {
"command": "python",
"args": ["-m", "flexberry_markitdown_mcp.server"]
}
}
}
Или с виртуальным окружением:
{
"mcpServers": {
"flexberry-markitdown": {
"command": "C:\\path\\to\\flexberry-markitdown-mcp\\.venv\\Scripts\\python.exe",
"args": ["-m", "flexberry_markitdown_mcp.server"],
"cwd": "C:\\path\\to\\flexberry-markitdown-mcp"
}
}
}
{
"mcpServers": {
"flexberry-markitdown": {
"command": "python3",
"args": ["-m", "flexberry_markitdown_mcp.server"]
}
}
}
Или с виртуальным окружением:
{
"mcpServers": {
"flexberry-markitdown": {
"command": "/home/user/flexberry-markitdown-mcp/.venv/bin/python",
"args": ["-m", "flexberry_markitdown_mcp.server"],
"cwd": "/home/user/flexberry-markitdown-mcp"
}
}
}
Если используется uv:
{
"mcpServers": {
"flexberry-markitdown": {
"command": "uv",
"args": [
"--directory",
"/path/to/flexberry-markitdown-mcp",
"run",
"flexberry-markitdown-mcp"
]
}
}
}
convert_to_markdownКонвертирует файл в Markdown и сохраняет результат рядом с исходным файлом.
Параметры:
file_path (обязательный) — путь к файлу для конвертацииoutput_path (опциональный) — пользовательский путь для сохранения результатаoverwrite (опциональный, по умолчанию false) — перезаписать существующий файлПример использования в RooCode:
Convert file /home/user/documents/report.pdf to Markdown
get_supported_formatsВозвращает список поддерживаемых форматов файлов.
check_file_existsПроверяет существование файла и возвращает информацию о нем.
Convert file C:\Documents\Report 2024.pdf to Markdown
Результат будет сохранен в C:\Documents\Report 2024.md
Convert file /home/user/report.docx with overwrite existing
Convert presentation.pptx and save result to /tmp/output.md
Сервер разработан для работы с файлами любого размера:
Это позволяет работать с файлами, которые в 100 раз превышают лимит контекста LLM.
Журналы сервера сохраняются в:
~/.flexberry-markitdown-mcp/server.logC:\Users\<user>\.flexberry-markitdown-mcp\server.logpip install flexberry-markitdown-mcp
pip install flexberry-markitdown-mcp
Убедитесь, что в терминале используется кодировка UTF-8. Сервер автоматически устанавливает UTF-8 для stdin/stdout/stderr.
Установите Tesseract:
sudo apt install tesseract-ocr (Ubuntu/Debian)Для русского языка установите языковой пакет:
sudo apt install tesseract-ocr-rusMarkItDown использует Azure Speech Services для транскрипции. Убедитесь, что переменные среды настроены.
pip install -e ".[dev]"
pytest
flexberry-markitdown-mcp/
├── src/
│ └── flexberry_markitdown_mcp/
│ ├── __init__.py
│ └── server.py
├── pyproject.toml
├── README.md
├── install.sh
├── install.bat
├── uninstall.sh
├── uninstall.bat
└── roocode-config-examples.json
MIT License
Разработано командой Flexberry.
Run in your terminal:
claude mcp add flexberry-markitdown-mcp -- npx Security
Low riskAutomated heuristic from public metadata — not a security guarantee.