文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

确保贵企业的数据为生成式AI做好准备的七个方法

2024-11-30 03:29

关注

审校 | 重楼

大家都想利用生成式AI和大语言模型的力量,但这有一个难题。让AI满足高的期望需要高质量的实用数据,这正是许多组织的不足之处。

麦肯锡最近一份由Joe CasertaKayvaun Rowshankish共同撰写的报告指出,许多组织要求用生成式AI做什么。然而,这种压力伴随着其他问题如果贵企业的数据还没有为生成式AI做好准备,贵企业也就没有为生成式AI做好准备。

报告作者建议,IT和数据管理员需要对生成式AI的数据含义有一个清晰的认识。数据可能通过应用编程接口或企业自己的模型借助原先存在的服务来使用这不仅需要更大笔的投入,还需要复杂的数据标记和标策略。

Caserta及其团队认为,也许最具挑战性的是生成式AI处理非结构化数据的能力,比如聊天、视频和代码。数据组织历来只能处理结构化数据,比如表中的数据。

这种数据方面的转变意味着组织需要重新考虑支持生成式AI项目的整体数据架构。虽然这听起来像是旧新闻,但以前企业可以逃避的系统漏洞将成为生成式AI的大问题。如果没有强大的数据基础,生成式AI许多优点根本不可能实现。

在整个行业,越来越多的领导者对企业处理可以应对生成式AI等新兴挑战所需的大量流入数据的能力表示担忧。Faction Inc.技术和运营副总裁Jeff Heller表示:“在不断创新和技术进步的推动下,数字化转型意味着组织运作方式要有所转变。

此外,AI并不是促使企业需要更有效响应更迅即的数据架构的唯一因素。Interzoid创始人兼首席执行官Bob Brauer表示:“客户将继续期待量身定制的服务和沟通,这当然在很大程度上依赖准确的数据。

传达出来的讯息很明确——企业是制定战略采用先进技术的时候了确保数据仍然是宝贵的资产,而不是沉重的负担

专家建议,为了让数据为快速崛起的AI时代做好准备需要考虑以下几个因素

1. 制定数据治理策略:有了合适的优先事项、员工、治理、工具和管理层要求,企业可以将数据质量挑战由负担变为重大的竞争优势。为了让AI及其他计划背后的数据获得组织支持一个步骤可能是创建一个工作组,研究如何运用生成式AI的新兴创新、大语言模型及基于AI的其他新技术以获得竞争优势

2. 制定数据存储策略找到一个存放所有数据的地方,并使数据能够易于发现和访问,这是一项必要的工作昆腾首席开发官Brian Pawlowski表示,最近的行业调查发现,一半以上(60%)的存储数据处于非活跃状态,这意味着这些数据很少或从未被访问过。即便如此,企业也不想丢弃这些数据,因为它们明白,这些数据可能会在未来几年提供宝贵的解决方案和商业价值,尤其是在生成式AI广泛应用的情况下。这难题需要重新评估现有能力,以建立现代化、自动化的存储架构,以便人们能够在整个生命周期内轻松访问和处理活跃数据和活跃数据。

3. 确保拥有数据质量策略准备数据架构处理AI带来的新需求,需要从确保很高的数据质量成为战略优先事项入手。一个好的开端是任命首席数据官或类似职位,专门为数据质量项目提供预算和资源。

4. 确保评估进度:领导优先事项应该包括面向整个企业的数据评估,并制定衡量成功的指标和目标

5. 保拥有处理非结构化数据的能力与传统的机器学习模型相比,生成式AI模型方面的数据质量问题变得更明显,因为有太多的数据,而且其中大部分是非结构化数据因而很难使用现有的跟踪工具。将来,非结构化数据约占所生成的数据总量的90%,未来五年全球存储容量的复合增长率将达到25%。这些非结构化数据存储在文件和对象中高分辨率视频和图像、复杂的医疗数据、基因组测序、机器学习模型的输入、捕获的有关自然界的科学数据如绘制油气田地图以及现实模拟,包括特效、动画和增强现实。组织部署解决方案,以自动化方式管理数据的生命周期,并利用AI等尖端技术帮助提取更高的商业价值,这一点至关重要。

6. 将支持广泛用例的功能融入到数据架构中:相关的功能(比如矢量数据库和数据预处理后处理管道)融入到现有的数据架构中,特别是支持非结构化数据方面的功能

7. 利用AI帮助构建AI:使用生成式AI帮助管理自己的数据。生成式AI可以现有任务,并改善整数据价值链上从数据工程到数据治理和数据分析的各种任务处理方式

原文7 ways to make sure your data is ready for generative AI,作者:Joe McKendrick

来源:51CTO内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯