智源社区

Nat. Mach. Intell. 速递:测试用于预测人类语言判断的自然语言模型的极限

本文介绍了一种新的方法来测试神经网络自然语言模型的性能,以预测人类语言判断的准确性。通过使用生成模型来评估模型的性能,研究人员发现,即使是最先进的...

中文LLaMA-2刷榜,开源可商用!千元预算,训练半天,效果媲美主流大模型

LLaMA-2是一种中文汉化模型,经过15小时的训练和数千元的算力,其性能超过同级别的模型。相较于LLaMA-1,LLaMA-2引入更多高质量的语料,实现了显著的性能提升...

再看文档智能前沿之GeoLayoutLM:一种用于视觉信息提取(VIE)的多模态预训练模型基本原理

2023年9月25日,北京阴天,飞往重庆。GeoLayoutLM是一种用于视觉信息提取的预训练模型,通过几何关系和预训练任务提高文本和布局的特征表示,从而提高文档信...

活动报名 | 图可信学习与图大模型研究进展

9月27日,浙江大学计算机科学与技术学院副教授况琨、北京航空航天大学副教授王啸和浙江大学计算机学院副教授杨洋将在青源会举办活动,分别分享图自监督学习、...

ChatGPT大更新!能看能听也能说,多模态功能即将上线

OpenAI最新博客中宣布,ChatGPT将推出语音和图像功能,用户可以通过语音或图像与ChatGPT交流,这一功能将在未来两周内向付费用户推出,不久之后会推广到其他...

清华系大模型公司聆心智能发布 CharacterGLM:玩转 AI 角色扮演,6B 模型已开源

聆心智能团队开发了CharacterGLM,用于实现千人千面的社交对象的可定制化。该模型以ChatGLM模型为底座,具有不同参数量。团队将对社会开放12B和66B模型的API...

千问的大模型KnowHow

通义千问发布了14B参数的模型,并公开了一份详尽的技术报告,分享了训练8个模型的经验。他们开源的13B模型比SOTA有更好的表现,预训练数据超过3T token。详细...

Nat. Genet. | 深度蛋白质语言模型在基因组范围内预测疾病变异效应

该论文介绍了一个使用ESM1b蛋白质语言模型来预测人类基因编码变异效应的工作流程。尽管最近的深度学习模型在预测准确性方面有所改进,但由于依赖于近源同源物...

JCTC | 新型SiteFerret算法助力蛋白质结合口袋的自动检测

SiteFerret是一种基于几何的口袋预测算法,结合了基于机器学习的排序策略,可用于预测蛋白质活性位点。该算法是一项科学挑战的创新解决方案,能够在口袋预测...

我,大语言模型

者),但我也不能像人类一样有奇思妙想。睡眠质量对人类的创造力和思维能力有着重要影响,因此保持良好的睡眠习惯非常重要。
1 12 13 14 15 16 60