人工智能训练师,也叫数据标注师,于2020年被正式纳入国家职业分类目录,而今大模型创业的浪潮正在给这个目录添加更多新内容。
在领英全球平台发布的工作职位中,AI新技术的职位发布相比半年前暴涨21倍。国内方面,百度、360集团、阿里巴巴国内三家国内大模型巨头近日开启招聘,其中,360集团为360智脑招募含大语言模型算法、数据加工与清洗、模型安全等9大方向人才。
《中国经营报》记者了解到,本轮国产AI大模型热潮除了让算法工程师、机器视觉、AI产品经理等岗位招聘升温之外,还让大模型合规以及评估相关的岗位需求大增。“做大模型的公司多了,国家也出台了相关法规,他们需要拿牌照;同时为了能发布,大模型发布前需要找很多人做内容评估,模型的改进同时也需要大量评估人员跟进。”资深人工智能从业者黄颂对记者表示,不同的评估案例,以及重复迭代评估,如此大的工作量都需要人力配合。
记者还注意到,8月31日,首批通过《生成式人工智能服务管理暂行办法》备案的大模型百度文心一言、百川智能、商汤商量SenseChat宣布当日起面向全社会开放服务。
国产大模型通过备案开始向公众开放将对行业带来怎样的影响?百川智能回应称:“既带来了挑战,也带来了机遇。这意味着大模型将在更规范的监管环境下运行,同时也需要满足更多的合规性和安全性要求。”
AI人才平均年薪30万元
“AI大模型浪潮正在创造许多与AI研发、应用和规划相关的新职位,技术和非技术方向都存在大量机会。”Magic AI联合创始人刘付江表示,借助这波大模型势头,数据工程师/数据科学家、ML(机器学习)工程师、AI研究员、AI产品经理、AI交互设计师、AI系统整合工程师等与AI相关的岗位需求热度在增长,其中“AI伦理审查员”表现亮眼,该职位主要是考察AI系统的伦理风险并提出改进建议。
根据猎聘大数据,今年1~7月,在人工智能行业主要三级职能新发职位分布TOP15中,算法工程师位居首位,占比为6.15%,机器视觉、深度学习、图像算法、机器学习、自然语言处理等AI强关联职位也榜上有名;猎聘大数据还显示,人工智能行业人才平均年薪已达到30.09万元。
北京社科院副研究员王鹏表示,本轮由大模型引发的AI热潮对于人工智能人才的招聘具有千舟竞发、层次多样的特征。“一是所涉及的范围广,有做基础研发的,有做应用研究的;二是相关的赛道门类多,无论是计算机视觉、自然语言处理,还是做相关的应用,甚至多模态,都涉及相关人才的招聘;三是人才的层次丰富,包括最核心的、技术含量最高的算法模型工程师,同时也包括具体做前端做应用的项目经理,或是开发人员,乃至于做基本标注相关的人工智能或大模型标注员。”王鹏说。
Co-Found智库秘书长张新原表示,本轮AI人才招聘热具有热度高、需求广泛、竞争激烈以及对技术能力和创新能力要求高等特征。“从国内大厂招聘来看,这些大厂的AI大模型的重点方向包括深度学习、自然语言处理、计算机视觉、智能语音交互等方向。”张新原还指出,对于AI的可信性和安全性的重视,也成为AI大厂招聘的共同之处。
天使投资人、资深人工智能专家郭涛也持类似观点。“国内大厂AI大模型的人才需求主要围绕自然语言处理、计算机视觉、人工智能安全等领域,跨场景应用、多模态交互将是大模型的重点发展方向。”郭涛表示,随着AI技术的不断发展和广泛应用,对AI相关人才的需求也会不断增加,因此AI招聘市场热还将持续很长一段时间。“不过,具体情况仍需要观察未来的行业发展、人才培养和技术发展情况。”他补充道。
AI离不开人工数据标注
目前,正在制药行业做AI技术辅助的黄颂表示,在和大厂做AI大模型的朋友交流过程中,能明显感觉到大模型厂商对于生成式内容的安全审核以及大模型评估的焦虑。
“国家出台了相关法规,大模型公司需要拿牌照,为了能发布,发布前需找很多人去做内容评估。”黄颂指出,模型的改进也需要大量评估人员跟进,不同的能力、不同的评估案例,以及重复迭代评估,这些工作量很大,因此,“大模型相关的合规以及评估需求大增,对相关有经验的从业者需求也增加了”。
值得一提的是,黄颂希望自己的团队能招到复合型人才,既懂AI,也懂生物、化学、医药。“AI只是一个工具,还是要落地在行业上。”
今年7月10日,《生成式人工智能服务管理暂行办法》(以下简称“《办法》”)发布,由国家网信办联合国家发展改革委、教育部、科技部等七部门审议通过,自2023年8月15日起施行。
《办法》内容共24条,从生成式人工智能服务提供者的算法设计与备案、训练数据、模型,到用户隐私、商业秘密的保护,监督检查和法律责任等方面提出了相关要求。根据《办法》,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
也就是说,安全、合规是国内大模型行业的红线。事实上,大模型有个术语叫奖励模型(RM,reward model,也叫偏好模型),即通过打分和排序的动作让模型进一步与人类的偏好对齐,避免模型产生种种迷惑行为。
奖励模型、对齐,这就需要人工操作。记者注意到,百度近日宣布,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心。
据百度官方公众号介绍,当前,大模型正处在产业落地前期,高质量的数据是大模型实现产业化的关键要素。对于以 ChatGPT、文心一言为代表的生成式 AI工具,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),可以让大模型与人类价值观、思维方式不断对齐,使大模型更加好用。
为此,百度智能云升级了大模型数据服务能力,建设了国内首个专业大模型数据标注基地。百度称,为保障数据标注质量,百度智能云还搭建了全流程数据服务人才梯队,海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到100%。
“有多少智能,就有多少人工。”从某个角度看,这句在人工智能领域流传甚广的话不无道理。百度智能云数据标注基地业务产品负责人胡驰表示,人工标注将是大模型训练中绝对无法被替代的一部分,大模型数据标注员将会是一个长期的职业。
“比如当前被誉为最接近通用智能的大语言模型,依然离不开数据标注。它基于大规模无标注数据进行预训练,再经过精调,在各领域中得到很好的应用。这其中的一个重要环节,就是算法工程师需要使用高质量的、人类反馈的标注数据进行大模型精调,来帮助模型成长。”胡驰接受采访时表示。
文章转载自中国经营报,作者李玉洋
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则