đ تبدŰŮ ŮاŰŮâŮŘ§Ű ŮžŰâŘŻŰâا٠٠آŮŰŘł Ů... ب٠Markdown!
ŰÚŠ ڊتاب؎ŮŮŮ ŘŽŮب ٞاŰŘŞŮŮŰ Ř§Ř˛ ٠اŰÚŠŘąŮساŮŘŞ! (+ ŰÚŠ اٞŮŰÚŠŰش٠ڊ٠با استŮاد٠ازش سا؎ت٠شدŮ) Ř¨ŘąŘ§Ű ŘŞŘ¨ŘŻŰŮ ŮاŰŮâŮاŰ
- PDF (.pdf)
- PowerPoint (.pptx)
- Word (.docx)
- Excel (.xlsx)
- Images (EXIF metadata, and OCR)
- Audio (EXIF metadata, and speech transcription)
- HTML (special handling of Wikipedia, etc.)
- Various other text-based formats (csv, json, xml, etc.)
ب٠Markdown!
ŘŞŮŘśŰŘ Ř§ŘśŘ§ŮŮ ŮŘŻŮ ÚŠŮ ÚŮŘŻŘą Ů ŰâŘŞŮŮŮ Ř¨ŘąŘ§Ű ŘŞŘ¨ŘŻŰ٠ساد٠٠ستŮدات ŘłŮŘŞŰ Ů... ب٠ابزاعŮŘ§Ű Ů ŘŻŘąŮ ŮŰÚŠŰ Űا ŮÚŻŮŘŻŘ§ŘąŘ§Ű Ů ŘłŘŞŮدات Ů ŮŰŘŻ باشŮ!
from markitdown import MarkItDown
markitdown = MarkItDown()
result = markitdown.convert("test.xlsx")
print(result.text_content)
https://github.com/microsoft/markitdown