(资料图)
继今年7月在2023世界人工智能(161631)大会发起成立“中国大模型语料数据联盟”,上海人工智能(161631)实验室于8月14日宣布,联合语料数据联盟成员单位,共同开源发布“书生·万卷”1.0多模态预训练语料。“书生·万卷”1.0目前包含文本数据集、图文数据集、视频数据集三部分,本次开源的数据总量超过2TB。该语料数据包含超过5亿个文本,2200万个图文交错文档,1000个节目影像视频,具备多元融合、精细处理、价值对齐、易用高效等四大特征。(上证报)
关键词:
上一篇:雷军:高端是小米发展的必由之路 更是生死之战
下一篇:最后一页
凡本网注明“XXX(非中国微山网)提供”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和其真实性负责。
继今年7月在2023世界人工智能(161631)大会发起成立“中国大模型语料数
2023-08-14 20:43
小米董事长雷军8月14日晚在演讲时称,只有做高端,才能倒逼在技术上做
2023-08-14 20:48
ST阳光城(000671):公司股票已被深圳证券交易所决定终止上市,将于2023
2023-08-14 20:44
小米董事长雷军8月14日晚在演讲时表示,在5G专利上,小米专利占比4 1%
2023-08-14 20:46
陕西金叶(000812)8月14日晚间公告,控股股东万裕文化产业有限公司的一
2023-08-14 20:43
小米雷军于8月14日(周一)晚7点举办今年的年度演讲,主题是“成长”。这
2023-08-14 19:44
密尔克卫(603713):拟发行GDR募资不超过13 6亿元,用于收购LHNLogistic
2023-08-14 19:42
北京商报评论文章称,香港证券业发声要求撤销股票印花税,A股也可以考
2023-08-14 19:45
吉林敖东(000623)8月14日晚间公告,近日,公司控股子公司吉林敖东(0006
2023-08-14 19:55
2023年10月的川西温度怎么样是当下大家讨论最多的,毕竟9月因为很多学
2023-08-14 19:02