• 首页 >  人工智能 >  AI产业
  • Appen:澳鹏AI全景报告2024(12页).pdf

    定制报告-个性化定制-按需专项定制研究报告

    行业报告、薪酬报告

    联系:400-6363-638

  • 《Appen:澳鹏AI全景报告2024(12页).pdf》由会员分享,可在线阅读,更多相关《Appen:澳鹏AI全景报告2024(12页).pdf(12页珍藏版)》请在薪酬报告网上搜索。

    1、 澳鹏澳鹏AI全景全景 报告报告2024 迎接挑战,把握机遇 澳鹏澳鹏AI全景全景 报告报告2024 迎接挑战,把握机遇 版权所有 Appen 2024 保留所有权利 引言引言 随着人工智能(AI)的迅猛普及,我们在数据管理、模型可靠性和可扩展性方面所面临的挑战也日益严峻。在澳鹏AI全景报告2024中,我们探讨了推动AI发展的关键因素,包括生成式AI的兴起、企业面临的阻力、数据质量的重要性,以及为解决AI实施的复杂性而对战略伙伴关系日益增长的需求。澳鹏与美国哈里斯民意调查(The Harris Poll)联合开展了一项研究,对美国各行各业的500多位信息技术决策者(ITDM)进行了深入调研。研

    2、究结果揭示了影响AI未来的五大关键因素:生成式生成式AI的普及率持续攀升的普及率持续攀升 相比2023年增长17个百分点 企业部署和投资回报率企业部署和投资回报率(ROI)呈现下滑趋势呈现下滑趋势 部署并取得显著回报的项目比例降低 高质量数据成为高质量数据成为AI成功的关键成功的关键 97%的受访者认为数据多样性、减少偏见或可扩展性至关重要 数据挑战持续存在数据挑战持续存在 数据准备瓶颈问题增加10个百分点 公司寻求战略数据合作伙伴公司寻求战略数据合作伙伴 93%的受访者希望获得完整的AI数据生命周期专业知识 这些见解表明,虽然AI蕴含着巨大的变革潜力,但其能否真正取得成功,还取决于我们能否有

    3、效应对持续存在的数据挑战,并构建起稳固的合作伙伴关系。澳鹏致力于通过我们全方位的AI数据平台和覆盖全球的专业众包资源网络为各组织提供坚实后盾,助力企业从容应对AI领域的重重挑战。1.2.3.4.5.生成式生成式AI的普及率的普及率 持续攀升持续攀升 生成式生成式AI 的普及率 持续攀升 17个百分点个百分点 自自2023年以来年以来 定制数据定制数据采集采集已已成为成为 获取生成式AI(GenAI)训练数据的首选途径 2024年,随着自然语言处理(NLP)和聊天机器人应用的不断突破,生成式AI的普及率迅猛增长,与2023年相比,其增幅高达17个百分点。这一显著增长得益于其日益广泛的可用性和不断

    4、降低的准入门槛。各年的各年的AI用例用例 2023年年 2024年年 生成式AI用例 39%56%2澳鹏AI全景报告2024 众多企业正在积极采用生成式AI技术提高内部业务流程的生产力和生产效率,这是其被广泛采用的首要原因。IT运营支持是生成式AI的第二大常见应用领域,同时,其在研发领域的应用同比增长9个百分点。此外,生成式AI也在市场营销、通信和制造运营领域得到广泛应用。生成式生成式AI的使用的使用场景场景 2023年年 2024年年 提高内部业务流程的生产力和生产效率 49%53%支持内部IT运营 47%49%协助研发新产品 37%46%支持其他业务功能(例如营销、通信、设计)45%43%

    5、支持制造/生产运营 36%41%将基于生成式AI的功能运用到销售的产品或服务中 40%41%降低业务成本 37%41%澳鹏AI全景报告2024 尽管生成式AI发展迅速,但在生成式AI模型训练过程中,如何有效管理偏见并确保公平性,依然是一项严峻的挑战。为了应对这项挑战,定制数据采集已逐渐成为获取训练数据的首选方法,这充分凸显了其在创建可靠AI系统中的重要性。按按应用场景应用场景划分的最常用数据集划分的最常用数据集 澳鹏AI全景报告2024 合成合成数据数据 30%预标注预标注 27%定制定制采集采集41%企业部署和投资回报率企业部署和投资回报率(ROI)呈现下滑趋势呈现下滑趋势 随着企业在AI领

    6、域不断积累经验,企业在选择要推进的项目时变得愈发挑剔,导致成功部署的项目数量有所减少。澳鹏认为,这种趋势可能是由于ROI逐渐下降或缺乏显著成果所导致的,这背后的原因可能在于AI模型的复杂性不断攀升,同时企业所致力于解决的挑战性问题也日益棘手。然而,在应对这些挑战的过程中,用于训练和评估这些模型的数据质量起到至关重要的作用。AI项目的平均部署率和项目的平均部署率和ROI 澳鹏AI全景报告2024 高质量、定制化的人工生成数据能够显著提高AI模型的性能和可靠性。企业通过专家标注的训练数据与严格的评估流程相结合,能够使企业的模型更加贴合实际需求,从而提高准确性和相关性。由此,模型不仅能力更为强大,而

    7、且更有可能成功部署,并带来可观的ROI。随着AI系统应对的问题日益复杂,使用定制的人工生成数据,有助于减少错误,提高模型性能,并最终提升部署成功率,确保企业从AI投资中获得更多回报。在已部署的项目在已部署的项目中,取得显著回报中,取得显著回报的项目平均百分比的项目平均百分比 成功实现部署成功实现部署的的AI项目平均百分比项目平均百分比 年年 年年 年年 年年 高质量数据成为高质量数据成为 AI成功的关键成功的关键 在在AI领域,数据多样性是最受重视的特性领域,数据多样性是最受重视的特性,其次是减少偏见和可扩展性 80%的受访者的受访者 认同人类的洞察力是人类的洞察力是完善完善AI系统的关键系统

    8、的关键 我们的最新研究显示,绝大多数(86%)的受访者每季度至少重新训练或更新一次他们的机器学习模型。这一发现不仅凸显了整个行业的迅猛发展态势,还凸显了AI训练过程中数据与模型之间所形成的紧密且高效的反馈循环机制。90%的受访者确认他们在AI模型的训练和/或标注工作中依赖外部数据提供商提供支持。定制采集的数据集,特别是文本、图像、视频、音频和兴趣点(POI)数据方面,已成为许多领先AI应用的基石。这些模型的卓越表现,离不开数据的准确性、多样性和代表性。值得注意的是,80%的受访者强调了人机协同机器学习的重要性,一致认为人类的洞察力是完善AI系统的关键。在AI领域,数据多样性是最受重视的特性,其

    9、次是尽力减少偏见和确保数据的可扩展性。7%的受访者认为这些要素对于构建AI模型至关重要。高质量的人机协同训练和评估数据,在实现这些目标过程中起到至关重要的作用,能够提供细致、多样和准确的数据,为模型的完善、偏见的减少以及确保模型大规模可靠运行奠定基础。数据挑战持续存在数据挑战持续存在 获取高质量数据依然是一项严峻挑战,随着AI用例的专业化程度不断提升而愈发艰难。在AI项目中,数据管理已成为IT决策者(ITDM)面临的首要难题。据报告显示,自2023年以来,与数据获取、清理和标注相关的瓶颈问题显著增加10个百分点。同期,缺乏数据相关的瓶颈问题也上升7个百分点。这一增长趋势很可能源于生成式AI的应

    10、用范围迅速扩展,这些应用催生了新的数据需求,并与之前观察到的为生成式AI模型定制采集数据数量增多的现象相契合。瓶颈趋势瓶颈趋势 澳鹏AI全景报告2024 尽管在AI开发中,高质量数据标注具有举足轻重的地位,但自2021年以来,数据的平均准确性却呈现出约9个百分点的下滑趋势。这一现象的背后,可能是由AI系统日益增长的复杂性以及随之而来的数据标注要求带来的。这些要求不仅涉及更为专业的领域知识,还需要在庞大的数据集上实施严格的质量控制措施。美国平均准确性百分比美国平均准确性百分比 澳鹏AI全景报告2024 为了有效应对这些挑战,企业必须暂时放弃短期收益,着眼于AI创造的长期价值,并专注于以高质量数据

    11、打造坚实的部署基础。数据管理 缺乏数据 缺乏技术资源 缺乏技术工具 高层管理支持不足 预算不足 年年 年年 年年 年年 年年 年年 公司公司寻求寻求 数据数据战略战略合作伙伴合作伙伴 明智选择 数据合作伙伴 是模型成功部署 的关键所在关键所在 93%的的ITDM 强调,在AI生命周期的每一阶段,都需要专业知识和技术的支持,才能实现高质量的成果 对全面数据解决方案的迫切需求显而易见,85%的ITDM希望只依靠一家合作伙伴为AI数据生命周期的所有阶段提供支持。此外,93%的受访者寻求更有效的方法来管理他们的AI训练和优化数据。随着AI用例变得更加专业化,获取高质量数据变得愈发困难。企业发现数据标注

    12、工作中的一致性和准确性至关重要,95%的受访者强调,明智选择数据合作伙伴是模型成功部署的关键所在。与观察到的数据挑战相呼应,ITDM在选择数据标注解决方案时,最为看重的是高一致性和准确性。数据来源的重要性也在不断提升,这一趋势可能受到法规约束和负责任AI开发原则的推动。通过负责任地获取数据,我们可以有效降低版权侵权、信息误导和偏见输出等相关风险,提高AI系统的透明度和可追责性。最受重视的数据最受重视的数据标注标注平台特性:平台特性:高质量标注,标注具有一致性和准确性。价格实惠,性价比高。数据来源合法合规。质量有保证、工具和功能的可用性强。数据具多样性。结语结语 显而易见,通往AI成功之路可谓是

    13、道路崎岖、困难重重。在追求可靠且有效的AI系统的征途中,企业不仅面临着对高质量人机协同数据的迫切需求,还需应对管理偏见和确保公平性。然而,同样明确的是,只要采取正确的方法以及建立强大的合作伙伴关系,定能无艰不克。澳鹏深耕AI领域已逾二十五载,始终致力于通过数据采集、标注、评估、微调和监督服务,助力企业创建和改进AI模型。通过将我们深厚的专业知识与我们的AI数据平台相结合,我们能够高效地交付大型项目,确保提供的数据质量卓越。我们深知人机协同机器学习的重要性,凭借我们覆盖全球的由超过100万名众包资源和领域专家组成的人才网络,我们能够提供细致、多样和准确的数据,为模型的完善、偏见的减少和确保模型大

    14、规模可靠运行奠定基础。随着众多公司积极寻求数据战略合作伙伴以支持其AI事业的发展,我们可以随时满足其迫切需求。澳鹏始终坚守对质量、多样性和可扩展性的承诺,高度契合构建准确、公平、高性能AI模型所秉持的核心价值观。点击点击此处此处联系我们联系我们,详细了解,详细了解 澳鹏如何支持您的澳鹏如何支持您的AI部署部署计划。计划。调研调研方法方法 澳鹏AI全景报告2024调研旨在评估各企业/组织的AI和数据实施情况。澳鹏与美国哈里斯民意调查携手,于2024年4月18日至5月9日对509位信息技术决策者(ITDM)开展了一项在线调查。参与者年龄在21岁至65岁之间,并且在员工超过100人的公司工作。行业行

    15、业 汽车和运输 金融和金融服务 医疗保健和制药 互联网和电子产品 零售和耐用消费品(包括电子商务)科技 电信 角色角色 企业领导者和管理者 数据科学家 数据工程师 开发人员 公司规模公司规模 小型:101-1,000名员工 中型:1,001-10,000名员工 大型:10,001名以上员工 这项研究由美国哈里斯民意调查代表澳鹏在美国开展,采用在线方式,调查对象为509位信息技术决策者。调查于2024年4月18日至5月9日进行。原始数据未经过加权处理,因此仅代表完成调查的受访者个人。本次调查的受访者选自同意参与我们调查的受访者。哈里斯在线民调的抽样精度采用贝叶斯可信区间衡量。对于本研究,使用95

    16、%的置信水平,样本数据的准确性在4.3个百分点以内。这一可信区间在一小部分受调查的感兴趣人群中会更大。所有抽样调查和民调,无论是否使用概率抽样,均会受到其他多种误差源的影响,这些误差源往往无法量化和估计,包括但不限于覆盖误差、与无答复相关的误差、与问题措辞和响应选项相关的误差,以及调查后的加权和调整(在本调查情况下不适用)。注注:2023年的研究于2023年2月至3月开展,对象为400位美国ITDM和100位欧洲(英国、爱尔兰和德国)ITDM。2022年的研究由美国哈里斯民意调查于2022年6月进行,对象为504位ITDM;2021年的研究于2021年3月进行,对象为501位美国ITDM;2020年的研究采用不同的方法进行,对象为290位ITDM。