新零售网 > 观点 >

Meta称其LLaMA语言模型比OpenAI的GPT-3更有前景

来源:TechWeb 发布时间:2023-03-01 13:01   阅读量:11838   

在OpenAI推出大型语言模型ChatGPT后,竞争对手纷纷迎头赶上。谷歌有 Bard,微软有新必应。现在,Meta也上线了一个新模型LLaMA。目前,该模型只对研究人员开放。

据了解,LLaMA是 Large Language Model Meta AI 的首字母缩写词,比现有的模型更小,因为它是为无法访问大量基础设施的研究社区构建的。LLaMA 有多种尺寸,从70亿个参数到650亿个参数不等。

Meta方面称,尽管 LLaMA-13B 的尺寸较小,而且少了1620亿个参数,但“在大多数基准测试中”表现优于 OpenAI 的GPT-3。

据报道,最大的模型 LLaMA-65B 与 DeepMind 的Chinchilla70B和PaLM-540B等模型可相提并论。

LLaMA 是一个基础模型:它在大量未标记数据上进行训练,这使得研究人员更容易针对特定任务微调模型。由于模型更小,因此更容易针对用例进行再训练。

LLaMA不仅仅是使用英语文本构建的。Meta使用20种使用拉丁语或西里尔语脚本的语言训练其模型。然而,大多数训练数据都是英语,因此模型性能更好。

Meta 的研究人员声称,由于模型的大小,对当前大型语言模型的访问受到限制。

Meta 认为“这种受限访问限制了研究人员理解这些大型语言模型如何工作以及为何工作的能力,阻碍了提高其稳健性和解决已知问题的努力”。

除了使模型更小之外,Meta 还试图让 LLaMA 更易于访问,包括在非商业许可下发布它。

对各种 LLaMA 模型的访问权限只会根据具体情况授予学术研究人员,例如隶属于政府、民间组织和学术界的研究人员。

与 ChatGPT 一样,LLaMA 与其他语言模型一样存在生成有偏见或不准确的信息。Meta 的 LLaMA 声明承认了这一点,并表示通过共享模型,研究人员可以“更轻松地测试新方法来限制或消除大型语言模型中的这些问题。”

Meta在去年5月曾推出一款面向研究人员的名为OPT-175B的大型语言模型,去年年底还发布过另一款模型Galactica,但后者被发现经常分享有偏见或不准确的信息,在48小时内被迅速下架。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

特斯拉柏林超级工厂4000辆周产量目标实现时间早于预期 2023-03-01 12:43

嘀嗒出行三战IPO:没有新故事却多了新对手 2023-03-01 12:42

曹德云:保险资管机构要摆脱“买方心态”,进一步提升资产管理能力和 2023-03-01 12:36

融合发展更出彩 2023-03-01 12:02

电商平台从“小需求”里发掘“大市场” 2023-03-01 12:00

realmeGT3手机海外发布:搭载骁龙8+Gen1芯片,支持2 2023-03-01 11:48

市场风格轮动行业主题ETF表现亮眼 2023-03-01 11:42

“罕见病诊疗与管理科研基金公益项目”启动鼓励临床医生投身罕见病科 2023-03-01 11:26

两会声音中国离自己的ChatGPT还有多远? 2023-03-01 11:20

4G版本vivoV27手机现身GooglePlayConsole 2023-03-01 10:58

vivoS16手机新配色「春日悠蓝」开启预售,2399元 2023-03-01 10:29

苹果tvOS16.4开发者预览版Beta2发布 2023-03-01 08:31

绿色债券发展势头迅猛上交所将三方面推动绿债市场高质量发展 2023-03-01 08:21

深交所全面深化债券市场改革完善制度供给、产品供给、服务供给 2023-03-01 08:21

微软PCGamePass游戏订阅新增支持40个国家和地区 2023-02-28 18:03

分析师称苹果重启iPhoneSE4?升级6.1英寸屏并搭载自研5 2023-02-28 17:56

再斩佳绩复星保德信人寿荣获金理财“年度保障型保险产品奖” 2023-02-28 17:46

明日起,苹果iPhone、iPad、Mac换电池服务正式涨价:最 2023-02-28 17:34

2022年哪些技术领域增长最快?全球十大技术关键词出炉 2023-02-28 17:32

和治友德受邀参加第二届中国社交商业财富大会载誉而归 2023-02-28 17:17