400-090-9964


博客 | 论坛

行业动态

Oracle宣布Oracle云数据科学平台

时间:2020-02-26 来源:

  Oracle宣布Oracle云数据科学平台

  新服务使数据科学团队可以轻松快捷地协作构建和部署强大的机器学习模型

  Oracle自主数据库中对机器学习算法的新Python支持减少了移动数据的需求

  七项新服务,包括新数据目录,用于发现,查找,组织,丰富和创建数据资产;新的大数据服务提供了完整的Cloudera Hadoop实施;新服务提供对HDFS的SQL访问;新的完全托管服务以运行Apache Spark应用程序

  Oracle今天宣布了Oracle Cloud Data Science Platform的可用性。Oracle Cloud Infrastructure Data Science的核心是,它可以帮助企业协作构建,训练,管理和部署机器学习模型,以提高数据科学项目的成功率。与其他专注于单个数据科学家的数据科学产品不同,Oracle云基础架构数据科学通过共享项目,模型目录,团队安全策略,可再现性和可审计性等功能来帮助提高数据科学团队的效率。Oracle Cloud Infrastructure Data Science通过AutoML算法的选择和调整,模型评估和模型解释,自动选择最佳的训练数据集。

  如今,组织仅意识到数据巨大变革潜力的一小部分,因为数据科学团队无法轻松访问正确的数据和工具来构建和部署有效的机器学习模型。最终结果是,模型花费的时间太长,无法始终满足企业对准确性和鲁棒性的要求,并且过于频繁地永远无法将其投入生产。

  “有效的机器学习模型是成功的数据科学项目的基础,但是企业面临的数据量和种类繁多,可能会使这些计划在付诸实践之前就停滞不前,” Oracle Data and AI产品开发高级副总裁Greg Pavlik说。服务。“借助Oracle Cloud Infrastructure Data Science,我们可以通过自动化其整个工作流程并增加强大的团队支持协作来提高单个数据科学家的生产力,以帮助确保数据科学项目为企业带来真正的价值。”

  专为数据科学团队和科学家而设计

  Oracle Cloud Infrastructure Data Science包含自动化的数据科学工作流程,可通过以下功能节省时间并减少错误:

  AutoML自动算法选择和调整使针对多种算法和超参数配置的运行测试过程自动化。它检查结果的准确性,并确认选择了最佳模型和配置以供使用。这为数据科学家节省了大量时间,更重要的是,它旨在使每位数据科学家都能获得与最有经验的从业人员相同的结果。

  自动预测特征选择通过从大型数据集中自动识别关键预测特征来简化特征工程。

  模型评估会 生成一套全面的评估指标和合适的可视化文件,以针对新数据衡量模型的性能,并可以随时间对模型进行排名,以实现生产中的最佳行为。模型评估超出了原始性能,要考虑到预期的基线行为,并使用成本模型,以便可以完全合并误报和误报的不同影响。

  模型说明: Oracle Cloud Infrastructure Data Science提供有关生成预测的因素的相对权重和重要性的自动说明。Oracle Cloud Infrastructure Data Science提供了不可知模型的第一个商业实现。例如,借助欺诈检测模型,数据科学家可以解释哪些因素是欺诈的最大驱动因素,因此企业可以修改流程或实施保护措施。

  成功地将有效的机器学习模型成功投入生产,不仅需要专门的人员。这需要数据科学家团队共同合作。Oracle云基础架构数据科学提供强大的团队功能,包括:

  共享项目可帮助用户组织,启用版本控制并可靠地共享团队的工作,包括数据和笔记本会话。

  使用模型目录,团队成员可以可靠地共享已经构建的模型以及修改和部署它们所需的工件。

  基于团队的安全策略允许用户控制对模型,代码和数据的访问,这些模型,代码和数据已与Oracle Cloud Infrastructure Identity and Access Management完全集成。

  可再现性和可审计性功能使企业能够跟踪所有相关资产,从而即使团队成员离开,也可以复制和审计所有模型。

  借助Oracle Cloud Infrastructure Data Science,组织可以加速成功的模型部署,并产生企业级结果和性能以进行预测分析,以推动积极的业务成果。

  全面的数据和机器学习服务

  Oracle云数据科学平台包括七项新服务,这些服务可提供旨在加速和改善数据科学成果的全面的端到端体验:

  Oracle云基础架构数据科学:使用户能够使用Python和其他开源工具和库(包括TensorFlow,Keras和Jupyter)在Oracle Cloud上构建,训练和管理新的机器学习模型。

  Oracle自治数据库中强大的新机器学习功能:机器学习算法紧密集成在 Oracle自治数据库中,并新增了对Python和自动机器学习的支持。即将与Oracle Cloud Infrastructure Data Science集成,将使数据科学家能够使用开源和可伸缩的数据库内算法开发模型。独特地,将算法应用于Oracle数据库中的数据可减少数据准备和移动,从而加快了实现结果的速度。

  Oracle Cloud Infrastructure数据目录:允许用户发现,查找,组织,丰富和跟踪Oracle Cloud上的数据资产。Oracle Cloud Infrastructure数据目录具有内置的业务术语表,可轻松组织和发现正确的可信数据。

  Oracle大数据服务:提供完整的Cloudera Hadoop实施,与其他Hadoop产品相比,其管理要简单得多,只需单击一下即可使集群具有高可用性并实现安全性。Oracle大数据服务还包括用于Spark的机器学习,从而使组织可以使用一种产品和最少的数据移动在内存中运行Spark机器学习。

  Oracle Cloud SQL:对HDFS,Hive,Kafka,NoSQL和对象存储中的数据启用SQL查询。只有CloudSQL才能使能够与Oracle数据库对话的任何用户,应用程序或分析工具透明地使用其他数据存储中的数据,并具有下推,横向扩展处理的优势,可最大程度地减少数据移动。

  Oracle云基础架构数据流:一项完全托管的大数据服务,允许用户在无需部署或管理基础架构的情况下运行Apache Spark应用程序。它使企业能够更快地交付大数据和AI应用程序。与竞争的Hadoop和Spark服务不同,Oracle Cloud Infrastructure数据流包括一个窗口来跟踪所有Spark作业,从而使您可以轻松地识别昂贵的任务或解决问题。

  面向数据科学的Oracle云基础架构虚拟机:基于预配置的基于GPU的环境,具有常见的IDE,笔记本和框架,可以在15分钟内启动并运行,每天收费30美元。

版权所有@北京神脑资讯技术有限公司(CUUG,中国UNIX用户协会) Copyright 2017 ALL Rights Reserved 京ICP备11008061号 京公网110108006275号

CUUG旗下网站:www.cuug.com.cn www.cuug.com oracle.cuug.com bbs.cuug.com bd.cuug.com

电话:010-59426307 010-59426319 邮政编码:100089

海淀校区:北京市海淀区紫竹院路88号紫竹花园4号楼D座703(CUUG)