旨在更好地支持机器学习和分析环境,Pentaho Labs昨天宣布通过Pentaho数据集成(PDI)开发了Python语言的本机集成。
PDI基本上是ETL的便携式“数据机器”,您可以通过MapReduce或Yarn部署作为独立的Pentaho集群或Hadoop集群。Pentahi Subsadi ove Pentaho的Pentaho Labs副总裁Gorman表示,整合意味着数据科学家现在可以使用最受欢迎和灵活的开源语言来提高生产力和数据治理,同时支持预测分析和机器学习。他表示,该集成还将使得数据科学和预测建模更易于开发商社区。
“Python是从社区角度增长最快的环境,”Gorman说。“而大部分球队正在使用Python来构建机器学习和分析环境。”
去年,CodeeVal表示,它的数据显示,Python是第四年运行的最受欢迎的编码语言,其次是Java,C ++和JavaScript。一年中的一项由奥卡多技术委托的研究发现,Python已成为在小学教授的最受欢迎的语言,击败法国人。
“随着数据科学领域继续在研究和统计数据的世界之外发展,我们的团队为具有各种编程语言的ARM开发人员来说,”Gorman说。“Python为开发人员提供了具有一般目的语言的数据科学的另一个选择。通过这些语言,数据科学家有能力使用最合适的语言,随着通过PDI的数据使用预处理的使用增加。“
Gorman还表示,Python是深度学习研究人员的首选语言,在数据科学中提供更容易开发预测模型的能力。
“Python被开发人员和工程师广泛部署,以创建统计分析工作流程,特别是在金融,石油和天然气和物理学等领域,”Matt Aslett,451研究总监在周二的声明中说。“我们将Python视为人工智能发动机的主要语言,Pentaho的蟒蛇本土集成将允许组织应用他们的深层域专业知识并改进预测分析和机器学习算法。”
pdi for python可用于在Pentaho Marketplace下载。
这个故事“Pentaho增加了本土Python集成”最初由CIO发布。
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。