成都万息岗前集训中心

400-888-4011

全国学习专线 8:00-22:00
成都万息岗前集训中心
5个月学习,学完付钱,免费住宿,高薪保底合同  入学即签薪酬协议  方向86个不受行业局限  
您当前的位置: >成都凯学网 >成都培训学校 >Java开发机器学习库Tribuo

成都Java学校新闻

Java开发机器学习库Tribuo

发布时间:2021-04-21 17:59:45 已帮助:116人 来源:成都万息岗前集训中心

Java开发机器学习库Tribuo

Oracle开源Java机器学习库Tribuo
学习库提供了分类、回归、聚类、模型开发等的工具,Oracle 开源了一个用 Java 编写的机器学习库,把其命名为 Tribuo。来成都万息岗前集训中心学习如何使用 Tribuo。

Java开发机器学习库Tribuo

  Oracle开源了一个用Java编写的机器学习库,把其命名为Tribuo。
  学习库提供了分类、回归、聚类、模型开发等的工具,也为许多流行的第三方机器学习库提供了统一的接口。使用Tribuo从其他系统和语言部署模型很方便,它提供了指向ONNX Runtime、TensorFlow和XGBoost的接口。其中,对onnx模型的支持允许在Java中部署一些Python软件(例如pytorch)训练的模型。
  Oracle提到,他们这些年来致力于将机器学习模型部署到大规模的生产系统中。在这个过程中,他们发现,企业的期望往往与现有的机器学习库提供的功能之间存在着鸿沟。
  举个例子,大型的软件系统通常希望可以使用可自我描述的构造块,并可以判断何时的输入与输出是无效的。然而大多数机器学习库仍然依靠一堆浮点数组来训练模型。在部署时,输入是一个浮点数组,并且产生另一个浮点数组作为预测输出。关于这些数组中任何一个的含义,或输入/输出浮点数应该是什么样的描述,都留给Wiki和错误跟踪器,或被写为代码注释。Oracle指出,开发者不会希望为每个机器学习模型添加另一个数据库表只是为了解释输出浮动数组的含义。
  另一方面,在生产中跟踪模型也很棘手,因为它需要外部系统来保持已部署模型与训练过程和数据之间的链接。Oracle的机器学习研究小组认为,将这些额外的要求直接嵌入机器学习库会好得多。
  编程语言上,大多数流行的机器学习库都用Python和R等动态语言编写,而多数企业系统是基于Java等静态类型语言的。这就要求企业同时使用不同语言来编写代码,并确保其运行,也会因此产生更多的代码维护成本和系统开销。
  此次开源的Tribuo则能够妥善处理这些问题。Tribuo具有数据加载管道、文本处理管道和功能级别转换,可在数据加载后对其进行操作。它知道自己输入/输出了什么,并可以描述每个输入/输出的范围和类型。
  使用Tribuo从其他系统和语言部署模型也很方便,它提供了指向ONNX Runtime、TensorFlow和XGBoost的接口。其中,对onnx模型的支持允许在Java中部署一些Python软件(例如pytorch)训练的模型。
  所有模型和评估都括一个可序列化的出出对象,该对象记录了模型或评估的创建时间、数据的身份以及应用于它的任何转换,以及培训师的超等值器。在评估中,此来源信息还括使用的特定模型。证明信息可以提取为JSON,或者直接使用Java序列化进行序列化。对于生产部署,可以编辑来源信息,并替换为哈希,以便通过外部系统提供模型跟踪。
  Tribuo目前支持Java 8及更高版本。Oracle表示该机器学习库已经在公司的内部生产中运转了数年。


上一篇:WEB前端开发的小技巧,你知道几个?
下一篇:企业需要的JAVA技术人员需要具备哪些素质?

相关课程

关于我们 | 联系我们 | 成都万息岗前集训中心地址:成都市高新区益州大道北段1599号孵化园9号楼 咨询电话:400-888-4011
沪ICP备12032008-6 网站地图 注册 登录 招生合作 版权/投诉 免责声明 更新时间:2024-05-08