🚀 تبدیل فایل‌های پی‌دی‌اف و آفیس و... به Markdown!

🚀 تبدیل فایل‌های پی‌دی‌اف و آفیس و... به Markdown!


یک کتابخونه خوب پایتونی از مایکروسافت! (+ یک اپلیکیشن که با استفاده ازش ساخته شده) برای تبدیل فایل‌های

- PDF (.pdf)

- PowerPoint (.pptx)

- Word (.docx)

- Excel (.xlsx)

- Images (EXIF metadata, and OCR)

- Audio (EXIF metadata, and speech transcription)

- HTML (special handling of Wikipedia, etc.)

- Various other text-based formats (csv, json, xml, etc.)


به Markdown!


توضیح اضافه ندم که چقدر می‌تونه برای تبدیل ساده مستندات سنتی و... به ابزارهای مدرن ویکی یا نگهدارای مستندات مفید باشه!


from markitdown import MarkItDown


markitdown = MarkItDown()

result = markitdown.convert("test.xlsx")

print(result.text_content)

https://github.com/microsoft/markitdown