2023-05-10 13:20:00 来源:钛媒体
钛媒体 App 5 月 10 日消息,OpenAI 今晨发布一个关于 GPT-4 语言模型解析神经元的对齐性研究成果,利用自研基于 GPT-4 技术的开源工具,来尝试计算其他架构、更简单语言模型上神经元的行为并对其进行评分,而且可以将其应用于另一种语言模型中的神经元——本次选择 4 年前发布、包含 307200 个神经元的大模型 GPT-2 为实验样本,公开了这些 GPT-2 神经元解释和分数的数据集。
(相关资料图)
" 我们的目标是使用 Al 来帮助我们理解 Al",OpenAI 的这一研究对 AI 行业意味着,利用 GPT-4 和机器学习技术就能定义、测量 AI 可解释性,未来在神经元层将会产生 " 大模型比人脑更会思考 " 技术趋势。
OpenAI 联合创始人 Greg Brockman 则表示:我们迈出了使用 AI 进行自动化对齐研究的重要一步。
与此同时,OpenAI 对此依然是一如既往的谦虚,文章称目前 GPT-4 生成的可解释实验还不完美,当比 GPT-2 更大模型时解释表现效果很差。OpenAI 可拓展对齐团队的 Jeff Wu 直言,本次研究中大多数解释的得分很低,GPT-4 或无法解释实际神经元那么多的行为,未来仍有技术改进空间。
据悉,自去年 11 月底至今,人工智能(AI)聊天机器人大模型 ChatGPT 风靡全球。根据 Similarweb 公布的最新数据,截至今年 4 月,ChatGPT 平台访问量达到 17.6 亿次,比 3 月份增长了 12.6%,同时已达到谷歌的 2%。ChatGPT 背后的大型语言模型(LLM),是基于大量文本数据训练、包含数千亿(或更多)参数的语言模型。在大数据时代,这类 AI 机器学习模型可以在提升产品销售、辅助人类决策过程中能够起到很大的作用,但是计算机通常不会解释它们的预测结果,而语言模型想要变得更强大,部署更广泛,就需要研究可解释性(interpretability),因为人类对模型内部工作原理的理解仍然非常有限,例如可能很难从中检测到有偏见、欺骗性内容输出。
站在 OpenAI 的角度看,大模型未来将和人脑一样拥有 " 神经元 "(neurons),这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。所以可解释性就是将模型能用通俗易懂的语言进行表达,把模型的预测过程转化成具备逻辑关系的规则的能力,从而通过查看模型内部来发现更多信息。
例如,如果有一个针对 " 漫威超级英雄 " 的神经元,当用户向模型提问 " 哪个超级英雄的能力最强 " 时,这个神经元就会提高模型在回答中说出漫威英雄的概率,或者是弄清楚为什么人类神经元,可以决定进行某些搜索引擎查询或访问特定网站,即逐步转化一种有数据可解释性的 " 无监督学习 " 模式。
OpenAI 这次使用 GPT-4 来解决可解释性的问题,就是希望能够使用自动化的方式,让机器提高 AI 数据准确性,文章称这是其对齐研究的第三支柱的一部分。据悉," 第三支柱 " 是公司 2022 年发布的《我们做对齐研究的方法》,具体对齐研究将由三大支柱支撑:利用人工反馈训练 AI;训练 AI 系统协助人类评估;训练 AI 系统进行对齐研究。
具体到本次研究成果上,OpenAI 开发了一套包含自动化工具和测试方法的评估流程:
首先,研究人员让 GPT-2 运行文本序列,等待某个特定神经元被频繁 " 激活 ";
然后让 GPT-4 针对一段文本生成解释,例如通过 GPT-4 接收到文本和激活情况判断漫威是否与电影、角色和娱乐有关;
随后用 GPT-4 模拟 GPT-2 的神经元接下来会做什么,预测行为;
最后评估打分,对比 GPT-4 模拟神经元和 GPT-2 真实神经元的结果的准确度,在下图这个例子中,GPT-4 的得分为 0.34。
使用上述评分方法,OpenAI 开始衡量他们的技术对网络不同部分的效果,并尝试针对目前解释不清楚的部分改进技术。OpenAI 表示,他们正在将 GPT-4 编写的对 GPT-2 中的所有 307,200 个神经元的解释的数据集和可视化工具开源,同时还提供了 OpenAI API 公开可用的模型进行解释和评分的代码,从而希望学术界能开发出新的技术来提升 GPT 模型解释分数。OpenAI 还发现,有超过 1000 个神经元的解释得分至少为 0.8 分,这意味着 GPT-4 模型可以解释大部分人类神经元,同时目前 GPT 理解的概念似乎和人类不太一样。该团队称,希望随着技术和研究方法的改进,进一步提高 AI 模型可解释性能力:如通过迭代解释,可以让 GPT-4 想出可能的反例在根据激活情况修改解释;使用更大的模型作出解释;以及调整已解释模型(explained model)结构等,用不同的激活函数训练模型有助于提高解释评分。
对于本研究局限性,OpenAI 表示,目前 GPT-4 生成的解释还不完美,尤其要解释比 GPT-2 更大的模型时,表现效果很差;神经元复杂行为无法用简短的自然语言描述;OpenAI 解释了神经元的这种行为,却没有试图解释产生这种行为的机制;而且整个过程算力消耗极大等。OpenAI 希望在未来的工作中可以解决上述这些问题。
最终,OpenAI 希望使用模型来形成、测试和迭代完全一般的假设,从而比肩人类大脑的想法和行为,以及将其大模型解释为一种在部署前后检测对齐和安全问题的方法。然而在这之前,OpenAI 还有很长的路要走。
" 我们希望这将开辟一条有前途的途径。"Jeff Wu 表示,这一技术可以让其他人可以在此基础上构建并做出贡献的自动化方案,从而解决 AI 模型可解释性问题,很好地解释这些模型行为,比如 AI 如何影响人类大脑中的神经元等。(本文首发钛媒体 App,作者|林志佳)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App
标签:
- 加快虚拟仿真实训基地建设 启动职业学校信息化建设试点很必要
- “双减”后如何在满足学生多样需求方面做“加法”?
- 处于生理活跃期且心理发展不成熟 高校开设公共卫生必修课很必要
- 价格低于相应蔬菜零售价 西安投放约1万吨政府储备蔬菜
- 深受年轻消费群体所青睐 国潮风商品成为年货新选择
知识
- 他把银行卡卖给骗子,“黑吃黑”“截胡”十万元
- “老司机”4S店试驾豪车 结果油门当刹车撞了
- 新开工改造城镇老旧小区5.34万个
- 发动巡河志愿者2万余名 “用心护好每一条河”
- 假客服的套路:伪装成大平台客服,层层布局引人上钩
人物
- 今日热议:OpenAI 重磅研究!用 GPT-4 解析 GPT-2 样本,开启 AI 思考之门
- 天津技能型人才落户办理材料_环球时讯
- 谷爱凌:关于我的传言 90% 都是假的
- “中国朋友为我的家乡修了一条致富路” 环球信息
- 西南医科大学深入公共卫生学院、人文与管理学院开展新一轮审核评估专项调研-全球速看
- 郏县红牛:叫响优质畜产品“金字招牌”-天天热门
- 25年执教190场!安帅将加冕欧冠第1:瓜帅排第4,狂人第5
- 石狮:强化沟通协作 推动建筑业高质量发展
- 银保监批了!比亚迪100%持股易安财险,自营车险的节奏?
- 江苏全面推进教育领域数字人民币试点 产业链未来盈利空间巨大
- 松下按摩椅MAC9新入坑小白吐槽,深度评测真相-天天观速讯
- 环球视点!中特估指数累计涨幅35.63%,17股累计涨幅超50%
- 虚拟账号交易乱象调查 租售支付账号风险大易成“替罪羊” 环球时快讯
- 天天热头条丨高铁掌掴案:还手即互殴?(豫论场)
- 当前时讯:浙江海宁皮革城直播_浙江海宁皮革城
- 环规止规通规使用方法 环规
- 呱呱财经手机直播房间_呱呱财经直播间哪个房间专家讲课好|速看料
- 妪怎么读什么意思 妪怎么读
- 华民股份:控股子公司拟采购石英坩埚2.16万件
- 当前报道:天舟有新知|“蛋壳”还能“放星星”
- 沃尔特p38手枪(沃尔特温克)
- 2023郑州高新区契税缴纳办理方式有哪些
- 合纵科技:公司不涉及元宇宙领域的投资
- 新方法有望实现细胞外囊泡的精确测量和荧光成像 全球速读
- 第十九届天津工博会开幕|热闻
- 天天观焦点:京东App 12.0版本上线 首页可展示百亿补贴金额
- 卢本伟直播间在哪-卢本伟直播间地址
- 乡村新体验篇|重庆·水墨画廊 汉丰湖休闲之旅|全球关注
- 什么是毛利率?毛利率的计算公式是什么?_热讯
- 【世界新要闻】江苏发布2022年海洋灾害公报,经济损失、死亡失踪人数均下降
- 新四军第一师_关于新四军第一师简介|全球速递
- 午后A股三大指数全线翻绿 中国银河、光大证券等打开涨停
- 2022年电商资本投入明显缩减|今热点
- 亚太实业因股权转让事宜收关注函:第四期股权转让款能否如期支付|天天时讯
- 最新资讯:miss change
- 补充公积金账号在哪里查询 有以下几种方法-世界速看料
- “小挣青年”又刷屏,热词变迁折射了啥? 天天速讯
- 电商概念股异动 跨境通直线拉升涨停
- 华为MatePad Air曝光-焦点速读
- 让自由的空间设计 延伸居所的更多可能
- 深圳首次向创投项目企业发放数字人民币贷款 “深圳创投日”第七站·走进龙华
- 中英意韩等国艺术家共创《三星堆》
- 当前快报:游泳脚抽筋了 游泳脚抽筋怎么办
- iQOO Neo 8 Pro 手机出现在谷歌支持设备列表中,明天发布
- 上次市价 4K+!看完「雷公」AJ4 美图就种草!
- 【世界速看料】零线火线地线怎么接线(零线火线地线的作用)
- 开启驾驶辅助后出了事儿,到底谁负责?
- 宁波电镀附着力测试_什么是附着力 世界独家
- 朴宰范演出要求女士化妆,究竟是怎么一回事? 世界速看料
- 世界热点评!纽市盘前:欧洲裁员潮在经济放缓迹象中愈演愈烈 5月8日现货黄金、白银、原油、外汇短线走势分析
精彩阅读
- 04月17日黄山前往贺州出行防疫政策查询-从黄山出发到贺州的防疫政策 环球短讯
- 理财顾问服务_关于理财顾问服务介绍
- 方案已公示!昌平113条道路和21村范围地名要确定了!
- 世界球精选!2023年享受音乐的乐趣作文400字 享受音乐的乐趣作文600字通用
- 天天热消息:豆粕概念上市公司股票_概念股名单(5/8)
- 鸡肉和鸭肉哪个营养价值最高?|全球观天下
- 环球视点!保亭部署乡村振兴重点工作 推进取得新成效
- 地下治污,地上造绿,农村污水变清流
- 深交所将启动支持四川资本市场高质量发展“金熊猫培育”计划 每日关注
- 东莞:常平两村通过“特色精品村”市级评审验收
- 平阴数字玫瑰在“云”上绽放
- 5月8日长江传媒涨停分析:教育,知识付费,知识产权概念热股
- “阳”了之后,孕妇、儿童、老人到底应该怎么“吃”?-全球速讯
- 公司注销程序是怎么样的呢?公司法第一百八十八条的内容是怎么样的呢?
- 世界热门:我国进入伏季休渔期 海鲜市场保供应
- 环球最新:自己开便利店怎么找货源
- 当前短讯!一次元二次元三次元是什么意思_介绍次元
- Unity 发布《金融科技类APP用户调研报告》,应用内广告和搜索广告成为获客突破口|世界热议
- 全球资讯:虽然阿尔卡拉斯在马德里大师赛夺冠,但德约科维奇仍是ATP第一
- 全球快看:湘图讲坛|张发财对话陈文韬:从虚构作品中探寻真实的历史记忆
- 茶道商城APP开发-茶道商城源码公司定制方案 世界微头条
- 中兵红箭5月8日盘中涨幅达5%|焦点精选
- 全球焦点!精准对接 助力就业
- 当前关注:“三侨生”和台湾省籍考生高考可享加分政策
- 【天天新要闻】政策性利好提振市场信心 助力5-6月猪价底部抬升
- 特发信息(000070.SZ):光芯片及激光技术联合实验室前一阶段工作已经结束
- 全球热文:贵阳中考成绩怎么查询2021招生网上咨
- 全国专升本院校有哪些专业(全国专升本院校有哪些)
- 全球等级最高的qq号_等级最高的qq号_每日信息
- 阳光之家志愿者活动_阳光之家
- 求个网址哪个大神知道_求个网站你知道的
- 世界今热点:Skandia公司CIO访谈:放弃直接迁移,强调稳步整合
- 天天讯息:买SUV送MPV座椅!试驾魏牌蓝山DHT-PHEV
- 每日快播:绽放“她”力量,欧拉汽车助力2023杭州女子半程马拉松圆满完赛!
- “深圳惠民保”已开放预约 将实现四大升级
- 当前最新:面对“成本上升、回报下降”窘境,药企何解
- 重点聚焦!热点 | 补服饰产业物流运输短板 潜江市云企华凯供应链项目开工
- 华纳药厂:子公司抗病毒药物溴夫定获原料药上市申请批准 天天快资讯
- 当前热议!高屹东在民族街道调研基层社会治理工作
- 环球精选!黄山市设站3座!这条高铁年底有望具备通车条件
- 跆拳道几岁开始学比较好知乎 跆拳道几岁开始学比较好_世界报道
- 【PE】MMD-PE技巧,制作泛用式边缘光SPA贴图-全球快播
- 观点:爱情保卫战吵闹爱不完_吵闹爱不完
- 如何让小乌龟开口吃食 龟龟怎样才能尽快的适应环境|环球新动态
- 护航文明旅游需要“硬手段”
- 4377游戏中心-7447游戏平台 快播报
- 恩施一天坑内现“飞天汽车”?系景区用索道运观光车,当地至今未通公路 天天快播
- 世界观点:具俊晔好不容易挺直的腰板,被小s这么一说,给嘲没了
- 真我史上最大底的传感器1/1.4英寸!真我11 Pro+影像越级? 当前快讯
- 游泳减肥需要力量训练吗?是先游泳还是先做力量训练? 环球快播报