ChangTianML核心特性

ChangTianML致力于面向AI for Science的场景的技术应用,帮助用户以低门槛的形式发掘更多自然科学和社会科学的规律,助力和推动产业数字化的发展。

产品核心功能

本平台在产品侧主要有以下核心功能:

① 自动化机器学习建模;

② 自动探索构建高级特征组;

③ 自动化时间序列机器学习任务构建;

④ 建模报告自动生成导出。

本平台支持以无代码自动化的形式进行机器学习建模,用户只需要上传定义好建模问题的数据集,然后设置待建模的特征标签以及时间预算,ChangtianML将自动在后台进行AutoFE(自动化特征工程)、AutoML(自动化模型选择和超参调优),自动构建出可解释性较强的高级特征组和性能优异的机器学习模型。整个建模过程中不需要写一行代码,大大降低了建模门槛,提高了建模效率。

本平台的AutoFE定义了一套标准通用的建模算子,通过ChangtianML自研的自动化特征工程算法,能够更高效地探索特征空间,同时最优化每个特征表征的方向,从而确定共同增益最大的特征组。这些高级特征有显式的公式展示,有更好的可解释性,给用户提供了解释数据的新角度新方法。

此外,本平台还支持自动化时间序列建模。时间序列数据的规律也存在在时间模式趋势和周期性中,那么在建模时就不仅仅要用当前时刻的特征信息来预测Y,更要回望当前时刻过去的特征信息,但是如何回望?回望多少?怎样挖掘出隐藏在时序中的高级特征,这些问题都显著增加了建模探索空间,更有必要使用自动化手段高效探索。

本平台将自动化机器学习方法扩展到时序机器学习领域,此外还创新性的内置了时序算子,在用户根据实际业务设置窗口长度后,会自动化的搜索构建时间序列高级特征,在有效提取过去信息的同时,还保证了特征的可解释性。

建模报告会记录建模人员的工作步骤、模型选择、特征工程、模型评估等关键步骤和结果,无论在科研还是工作中,都是建模人员的重要产物。本平台会在用户建模结束后自动生成建模示例报告,包含但不限于相关系数热力图分析、单特征分布、模型效果可视化分析等等。还提供了生成报告图表的API代码,供用户下载模型后快速完善报告内容。

技术核心能力

技术核心能力方面,逸思长天团队在自动化特征工程、持续学习样本增强领域不断探索,基于学界的最新成果,进行了进一步的研究,构建了自研的强化学习和演化计算框架。 这些技术使得本平台在经典案例中的表现,相对于开源的或者经典的工具,能够提高30%以上的精度。这使得普通的数据处理人员,无需具备机器学习建模专家的能力,就可以去使用我们的工具构建出不输于甚至远超专家建模表现的机器学习模型。建模效率,也得以从几十人天甚至几百人天,变到分钟级甚至秒级,大大节省人力成本。

最后更新于

这有帮助吗?