Hacker News with Generative AI: Document Conversion

Transform DOCX into LLM-ready data (contextgem.dev)
ContextGem provides built-in converter to easily transform DOCX files into LLM-ready ContextGem document objects.

Data Preparation, Software, Document Conversion

15 points by sergiishcherbak 437 days ago | 5 comments

SmolDocling: An ultra-compact VLM for end-to-end multi-modal document conversion (arxiv.org)
We introduce SmolDocling, an ultra-compact vision-language model targeting end-to-end document conversion.

Vision-Language Models, Document Conversion, Machine Learning, Computer Vision

66 points by prats226 482 days ago | 12 comments

LibreOffice, Document Conversion, Server, Open Source

5 points by mariuz 525 days ago | 0 comments