ML.NET 3.0 更新内容
由于大模型的爆火,ML.NET 似乎快被遗忘在角落了,这次3.0版本的发布意外中带着些欣喜。总结其新特性和改进主要包括以下几个方面:
深度学习场景的扩展
ML.NET 3.0增加了对象检测、命名实体识别和问答等深度学习场景的支持,这些场景都是基于 TorchSharp 和 ONNX 模型的集成和互操作性实现的。此外,还更新了与 LightGBM 的集成,使用了最新版本。
对象检测需要引用 Microsoft.ML.TorchSharp 3.0.0 包的 Microsoft.ML.TorchSharp 和 Microsoft.ML.TorchSharp.AutoFormerV2 命名空间。
|
|
命名实体识别和问答需要引用 Microsoft.ML.TorchSharp 3.0.0 包的 Microsoft.ML.TorchSharp 命名空间。
|
|
数据处理场景的改善
ML.NET 3.0对DataFrame进行了大量的增强和修复,包括支持String和VBuffer列类型,支持从SQL数据库和任意IEnumerable集合导入和导出数据,支持拼接不同顺序的DataFrame,支持处理重复的列名等。还增加了IDataView的互操作性特性,方便数据的加载、检查、转换和可视化。
Tensor Primitives 的集成
Tensor Primitives 是一套新的API,用于支持张量运算。ML.NET 3.0利用这些API提升了性能,特别是在.NET 8上运行时。Tensor Primitives 也是.NET中AI数值计算的下一步发展,建立在硬件指令和通用数学的基础上。
AutoML的增强
ML.NET 3.0的AutoML增加了对 Sentence Similarity、Question Answering 和 Object Detection 的支持,还增加了AutoZero 调优器、最大模型数量的设置、连续资源监控等功能。
入门和资源
在 Microsoft Docs 中了解有关 ML.NET、Model Builder 和 ML.NET CLI 的更多信息。
代码示例可以在 ML.NET Samples GitHub repo 和 ML.NET Community Samples 上找到。
- 原文作者:BeanHsiang
- 原文链接:https://beanhsiang.github.io/post/2023-12-03-announcing-ml-net-3-0/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议. 进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。