自然语言处理

针对开放条件下基于深度学习的自然语言处理健壮性不高、推理能力弱以及可解释性差等核心挑战,探索从数据驱动到知识驱动的范式跃迁

再看文档智能前沿之GeoLayoutLM:一种用于视觉信息提取(VIE)的多模态预训练模型基本原理

2023年9月25日,北京阴天,飞往重庆。GeoLayoutLM是一种用于视觉信息提取的预训练模型,通过几何关系和预训练任务提高文本和布局的特征表示,从而提高文档信...

活动报名 | 图可信学习与图大模型研究进展

9月27日,浙江大学计算机科学与技术学院副教授况琨、北京航空航天大学副教授王啸和浙江大学计算机学院副教授杨洋将在青源会举办活动,分别分享图自监督学习、...

ChatGPT大更新!能看能听也能说,多模态功能即将上线

OpenAI最新博客中宣布,ChatGPT将推出语音和图像功能,用户可以通过语音或图像与ChatGPT交流,这一功能将在未来两周内向付费用户推出,不久之后会推广到其他...

清华系大模型公司聆心智能发布 CharacterGLM:玩转 AI 角色扮演,6B 模型已开源

聆心智能团队开发了CharacterGLM,用于实现千人千面的社交对象的可定制化。该模型以ChatGLM模型为底座,具有不同参数量。团队将对社会开放12B和66B模型的API...

千问的大模型KnowHow

通义千问发布了14B参数的模型,并公开了一份详尽的技术报告,分享了训练8个模型的经验。他们开源的13B模型比SOTA有更好的表现,预训练数据超过3T token。详细...

Nat. Genet. | 深度蛋白质语言模型在基因组范围内预测疾病变异效应

该论文介绍了一个使用ESM1b蛋白质语言模型来预测人类基因编码变异效应的工作流程。尽管最近的深度学习模型在预测准确性方面有所改进,但由于依赖于近源同源物...

JCTC | 新型SiteFerret算法助力蛋白质结合口袋的自动检测

SiteFerret是一种基于几何的口袋预测算法,结合了基于机器学习的排序策略,可用于预测蛋白质活性位点。该算法是一项科学挑战的创新解决方案,能够在口袋预测...

我,大语言模型

者),但我也不能像人类一样有奇思妙想。睡眠质量对人类的创造力和思维能力有着重要影响,因此保持良好的睡眠习惯非常重要。

再看多语种大模型预训数据如何清洗:兼论文档结构信息对大模型问答的重要性及实现思路

本文讨论了在RAG行业文档问答中利用文档结构的方法。传统大模型在文档问题解答方面存在问题,因为文档无法在较小上下文长度内完成。现有工作侧重于从文档中检...

AI算力70年增长6.8亿倍,3个历史阶段见证AI技术指数级爆发

AI算力经过70多年的发展已经增长了6.7亿倍,未来AI能力将全面超越人类。AI行业才刚刚进入萌芽期,但已经有了许多令人惊叹的应用。AI模型现在能够写诗、生成图...
1 3 4 5 6 7 10