文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

本周六定位上海!解析百度文心(ERNIE)如何助力快速定制企业级NLP模型

2024-12-03 18:30

关注

ERNIE开创性地将大数据预训练与多源丰富知识相结合,持续学习海量数据中的知识,将机器语义理解水平提升到一个新的高度以中文模型为例,目前ERNIE已经学习了1500万篇百科语料和词语、实体知识,700万个人类对话,3亿的文章的因果结构关系,以及10亿次的搜索查询与结果的对应关系,以及2000万的语言逻辑关系知识。模型还在持续不断地建模新的海量数据与知识,不断地提升下游的应用效果。ERNIE在中英文的16个任务上已经超越了业界最好模型,全面适用于各类NLP应用场景

目前,EasyDL已预置了领先的预训练模型ERNIE2.0,并配套了多种NLP经典算法网络,支持了文本分类、短文本匹配和序列标注等典型文本处理任务。

近日,文心(ERNIE)重磅发布三项功能,新增定制多标签文本分类、情感倾向分析、文本实体抽取模型等功能同时数据管理能力也进一步增强,更好地满足NLP领域开发者需求,开发者可通过百度AI开发平台EasyDL进行使用。

EasyDL是百度大脑面向企业开发者推出的零门槛AI开发平台,基于百度自主研发的深度学习平台飞桨,结合业界先进的工程服务技术打造,覆盖视觉与自然语言处理两大技术方向,支持一站式智能标注、模型训练、服务部署等全流程功能。目前EasyDL已经被广泛应用在零售、互联网、安全生产、工业质检、教育、医疗、交通等20多个行业,拥有70多万用户。

使用EasyDL简单三步即可完成NLP任务配置与训练,性能优异。

那么,文心这么厉害,有没有机会和高工面对面,快速掌握技术原理与实际应用?

本周六,百度资深研发工程师空降上海,一个上午从文心(ERNIE)技术解析到实战演练为你解析如何定制企业高精度NLP模型。(文末海报报名哦)

我们先来点技术干货稍做预习,了解下文心(ERNIE)近期重磅上线的多项实用功能!

新增定制化多标签文本分类功能

“多标签文本分类”指对一段文本同时标记多个标签,如:“未来的学和教正在发生颠覆,学生将会在家里学习,机器人将走上讲台。”可对应标签为“教育”、“科技”。该功能应用场景广泛,如媒体场景中对新闻内容进行自动归类,在内容推荐场景中利用内容标签提升召回,通过自动标签功能对知识文档进行多层级分类等。

目前,EasyDL平台经典版和专业版均新增了这项功能,在“专业版”的任务配置过程中,开发者还可选择ERNIE Tiny、ERNIE Large、ERNIE Base三种各有所长的预训练模型。

新增定制化情感倾向分析功能

“情感倾向分析”指对一段文本进行“积极情感”或“消极情感”的判断,如“酒店位置很好,服务周到热情,下次一定会再来”的用户评价,部署模型后可直接得到“Positive(积极情感)”的标签和99%的置信度。

该功能最常应用于用户评论分析和舆情分析,比如商品、店铺的口碑分析,对事实性的新闻事件或互联网话题进行舆情分析等,在汽车、餐饮、酒店等多个垂类上,分析准确率可达到95%以上。

目前,该功能已经上线EasyDL经典版,后续平台将逐步增加基于实体级和句子级的情感分类,力求覆盖更多的应用需求。

 文本数据管理和数据标注功能全面升级

针对开发者数据管理和数据标注过程中的痛点,EasyDL支持了更加灵活的数据格式,当前可支持zip、Excel、TXT三种文件格式进行上传。除了提供在线标注能力外,还提供智能标注功能,大幅降低了开发者的标注成本,开发者可直接上传未标注数据体验该功能。

图:文本智能标注示意图

10 月 24 日当天,百度 AI 快车道飞桨开源框架高阶营线下课程 “闪现” 上海站,邀请 “魔都程序猿” 和 “沪上程序媛” 来到上海市徐汇区瑞平路 230 号保利时光里 B1-09——LOFAS 集聚空间,与百度资深高工、各位行业开发者相聚一堂。上海站内容绝对不会令你 “空脑而归”,开发全流程、部署工具、高精度目标检测、模型优化方案一一奉上,更有“全能”OCR、金牌推荐算法,一起来场硬核趴体吧!

想了解强大文心(ERNIE)背后的技术原理?

想更进一步快速掌握NLP模型开发方法与技巧?

想线下和百度资深研发与各行业开发者深度沟通?

本周六上午,就在上海徐汇区复兴路1199号A座5层,百度AI快车道EasyDL零门槛模型训练营,资深研发工程师详解NLP技术能力,并带来现场实操与面对面答疑解惑,助你三小时掌握EasyDL的NLP模型开发秘籍!

点击下方链接即可体验!

https://paddle.wjx.cn/m/93404058.aspx?udsid=798299

 

 

 

来源:51CTO内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯