微软推出微型AI自动编码模型phi-1,击败 GPT-3.5|环球关注
编程客栈()6月26日 消息:微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。
(资料图片)
据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。
微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。
在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S 编程客栈(37.6% ) 。
在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。
高质量数据带来差异
微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文js命名为“教科书就是你所需要的”。
他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。
“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大php小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”
与其他可用的编码模型相比,Phi-1仅限于 python 编javascript码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。
为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。
研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”
关键词:
- 微软推出微型AI自动编码模型phi-1,击败 GPT-3.5|环球关注(2023-06-26 13:29:43)
- 当前快报:感应开关市场现状 感应开关行业未来前景趋势分析(2023-06-26 13:46:00)
- 中国大唐集团有限公司2023年享受政府特殊津贴人员推荐人选公示_环球快消息(2023-06-26 13:25:27)
- 北京市东城区培新小学积极探索综合实践活动课程|快资讯(2023-06-26 13:28:19)
- 今日pd950钯金回收价格查询(2023年06月26日)_环球最资讯(2023-06-26 13:27:10)
- 今日看点:原神vicineko八重神子强行打扑克又疼又叫福利本子404观看地址(2023-06-26 13:36:44)
- 焦点讯息:按揭保费有望调低 香港市民首置换楼负担减少(2023-06-26 13:27:38)
- 焦点要闻:多点二次递表港交所:业务重心从电商服务逐渐转向零售云,过半收入来自物美(2023-06-26 13:29:45)
- 销量屡创新高,埃安高端化承压,或许破局只是时间问题?(2023-06-26 13:22:41)
- 全球热门:拳头公司发布《无畏契约》中新增特工“Deadlock”玩法演示预告(2023-06-26 13:30:57)
- 广州考古发现商时期文化遗存 体现中原夏商礼制南渐 微头条(2023-06-26 13:38:50)
- 中国拟立粮食安全保障法 提高防范和抵御粮食安全风险能力(2023-06-26 13:41:14)
- 95岁李嘉诚抄底 被斥趁火打劫 龙光 合景泰富“拼命”抵抗(2023-06-26 13:41:42)
- 海博思创冲刺科创板:储能系统收入复合年增长超219%,启明创投、IDG为股东_环球热门(2023-06-26 13:45:37)
- lol的yy开黑频道_lol英雄联盟YY开黑频道 572586 热资讯(2023-06-26 13:41:35)
- 信息:什么素食能代替肉的营养(2023-06-26 13:22:09)
- 天天简讯:普京乱局落幕后首露面有“玄机”?西方专家指瓦格纳将落此下场(2023-06-26 13:40:53)
- 今日看点:心之全蚀_全蚀狂爱MKV_720P 高清下载(2023-06-26 13:27:29)
- 朝鲜外务省副相会见俄罗斯大使,讨论了这些问题(2023-06-26 13:24:44)
- “你好,邻居!共享幸福时光”——城西社区搞起邻里节(2023-06-26 13:40:14)
- 【全球独家】《魔兽世界》灵魂兽位置全部坐标(2023-06-26 13:26:48)
- “日子好了,吼秦腔的气力更足了”(2023-06-26 13:24:53)
- 天天快消息!外观和动力均有升级 新款吉利星瑞申报图(2023-06-26 13:31:07)
- 抖音外卖“熄火”:放下1000亿GMV目标(2023-06-26 13:18:41)
- 2023斯诺克冠军联赛(排名赛)赛事停播及用户权益调整公告(2023-06-26 13:20:22)
- 武汉拍地:江夏城投底价5.84亿竞得纸坊P(2023)023号涉宅地(2023-06-26 13:26:01)
- 李嘉诚家族抄底内地房企项目,项目开发商之一已成被执行人(2023-06-26 13:40:57)
- 今日热搜:深圳通报百富兴大厦异响振动事件后续:房屋基础薄弱,将全面加固(2023-06-26 13:20:47)
- 【世界速看料】无锡灵活就业人员社保缴费基数2023标准,公布如下(2023-06-26 13:34:56)
- 狗仔曝蔡徐坤一夜情女主正脸照 手持打胎档案疑实锤 焦点速读(2023-06-26 13:31:17)
-
95岁李嘉诚抄底 被斥趁火打劫 龙光 合景
中钢网其他新闻资讯频道提供钢材行业其他新闻资讯,中钢网-免保证金、
-
海博思创冲刺科创板:储能系统收入复合年增
2022年营收超26亿元、净利润超1 82亿元。
-
lol的yy开黑频道_lol英雄联盟YY开黑频道 5
1、LOL小黑房开黑各种激情,各种不坑爹 神一般的队友!DOTA小黑房开黑请
-
信息:什么素食能代替肉的营养
关于什么素食能代替肉的营养的内容,包含素食主义者用什么代替肉的营养
-
天天简讯:普京乱局落幕后首露面有“玄机
由瓦格纳集团发动的“内战”戏剧性地在短短廿四小时间戛然落幕,其后俄
-
今日看点:心之全蚀_全蚀狂爱MKV_720P 高
我下有心之全蚀的电影,是用迅雷下载的,一个小时五十多分钟吧。你可以
-
朝鲜外务省副相会见俄罗斯大使,讨论了这些
报道称,双方就朝俄关系问题和共同关心的地区及国际形势问题交换了意见
-
“你好,邻居!共享幸福时光”——城西
本报讯(YMG全媒体记者姜晓通讯员王德源刘晓龙柳喜鹊 摄影报道)清洋
-
【全球独家】《魔兽世界》灵魂兽位置全部坐
魔兽世界灵魂兽是游戏中的怪物之一,这个怪物是比较好抓到的,这是非常
-
“日子好了,吼秦腔的气力更足了”
秦腔让移民群众精神文化生活丰富多彩。夏日傍晚,罗山脚下的吴忠市红寺
- 滚动
- 综合
- 房产