最近在开发智能文档搜索的工作中,我需要将各种文件转换为 Markdown 格式,然后通过向量化计算,把它们创建到向量数据库中,以便实现语义搜索文档的功能。并结合 LLMs 和 RAG(Retrieval Augmented Generation)来获取与搜索目标相关的文档内容完成二次创作。由于多模态下需要处理的文档类型太多了,我曾用 python 写了几个工具方法,使用 MarkItDown 来统一处理的。但现实问题是 MarkItDown 目前没有 .NET 版本的实现,而我的应用是 .NET 的程序,如果能有一个办法将 python 脚本无缝嵌入到我的 .NET 应用程序中那就太棒了,这就是我为什么要使用 CSnakes 的原因。

……

阅读全文