大模型
参数数量非常庞大的深度神经网络或其他机器学习模型。
Statler:面向具身推理的状态维持语言模型
面向具身推理的状态维持语言模型,大型语言模型(LLM)为机器人执行复杂的推理任务提供了有希望的工具,现代LLM的有限上下文窗口使得在长时间范围内进行推理变...
北大法律大模型ChatLaw
致力于提供普惠的法律服务。无法运用法律武器保护自己。大语言模型最近的崛起正好为普通人以对话方式咨询法律相关问题提供了一个绝佳契机。逻辑复杂的法律问...
LVM-Med:用于医学图像的自监督学习大规模视觉预训练模型
可用于2D-3D分割、图像分类和目标检测等下游任务。Git地址:GitHub:github.com/duyhominhnguyen/LVM-Med
大语言模型综述系统性升级
大语言模型综述系统性升级,我们在arXiv网站发布了大语言模型综述文章《A Survey of Large Language Models》的第一个版本V1,该综述文章系统性地梳理了大语言...
斯坦福|卷积增强大型语言模型
Conformer LLMs —— 卷积增强大型语言模型,随着大型语言模型(LLM)在各种领域的应用,本文目标是将卷积层和Transformer结合起来,用于训练大型语言模型。它在...
斯坦福|基于实时视觉的室内环境机器人导航
基于实时视觉的室内环境机器人导航。如何使机器人能够有效地避开障碍物并快速到达目的地成为了一个重要的研究问题:本文的目标是开发一个基于视觉的障碍物避...
Google DeepMind|大型语言模型的人格特征
并量化、分析和塑造广泛使用的LLM生成的文本中表现出的人格特征,提出一种使用心理测量学原则来描述和塑造LLM中合成人格的方法。开发了一种建立人格特征的结...
Google & Google DeepMind|面向不确定性量化的莫尔斯神经网络
面向不确定性量化的莫尔斯神经网络。如何量化神经网络预测的不确定性成为了一个关键问题。特别是当神经网络面对离群数据(Out-Of-Distribution,开发能够量化...
Google Research|数据集均衡化可能会影响模型性能
数据集均衡化可能会影响模型性能,可能会导致模型偏向于常见类别的性能。许多研究者使用数据集平衡技术来改善模型的性能,虽然平衡可以提高公开的 AudioSet ...
编程教育中的生成式人工智能:ChatGPT、GPT-4和人类导师的基准测试
编程教育中的生成式人工智能:ChatGPT、GPT-4和人类导师的基准测试,人工智能和大型语言模型在提升计算教育方面具有巨大的潜力。可以为初级编程提供下一代教...