标签:大模型

QR Code ControlNet模型二维码效果生成

QR Code ControlNet则是作者们新训练的一个二维码图像生成专用ControlNet模型,目前还在不断优化中。作者们尝试了不同的Stable Diffusion Checkpoint、LoRA和...

思想复制:通过模仿人类思维学习在行动中思考

通过模仿人类思维学习在行动中思考,通过模仿人类思考过程来改进强化学习智能体的表现。强化学智能体在泛化能力、探索能力、规划能力、适应新情境的能力等方...

Nature|专业技能可以提高人类游戏规划深度

专业技能可以提高人类游戏规划深度。研究在人类游戏中,专业知识如何增加规划的深度,采用了模型拟合方法。使用基于启发式搜索的计算认知模型:以验证人类的...

AI21 Labs|是人还是AI?图灵测试的游戏化方法

图灵测试的游戏化方法?来评估AI聊天机器人模仿人类对话的能力,以及人类是否能区分AI和人类。旨在揭示人类和AI相互交织的不可避免的未来,设计并发布了一个在...

吴恩达推出3节大模型系列课程,限时免费

扩散模型课程则由吴恩达的学生Sharon Zhou进行讲授:课程地址:学习如何使用思维链方式调用LLM来实现复杂工作流程的自动化:从新手到高级玩家都可以听这门课:...

神经网络重建3D物体,英伟达发布Neuralangelo|CVPR 2023

?智源社区日报关注订阅? Digital Renaissance: NVIDIA Neuralangelo Research Reconstructs 3D Scenes 英伟达团队提出Neuralangelo,从2D视频重建3D大规模场...

阿联酋猎鹰Falcon 40B模型开源,冲顶Huggingface大模型榜首

?智源社区日报关注订阅? Falcon LLM是一个基础性的大型语言模型(LLM),在一万亿个令牌上训练了400亿个参数。TII现已发布猎鹰LLM——40B型号。该模型仅使用GPT...

剑桥、腾讯AI Lab等提出大语言模型PandaGPT:一个模型统一六种模态

这是一种将大型语言模型与不同模态对齐、绑定以实现跨模态指令跟随能力的技术。PandaGPT 可以完成诸如生成详细的图像描述、根据视频编写故事以及回答关于音频...

伯克利|适用于长上下文大模型的分块并行Transformer

解决自注意力机制和大型前馈网络在Transformer中带来的内存需求问题,并且比之前的内存高效方法能处理2至4倍更长的序列,在语言建模和强化学习任务上进行的大...

透过神经科学视角探讨人工意识的可行性

透过神经科学视角探讨人工意识的可行性,对大型语言模型是否具有意识进行系统神经科学角度的探讨。采用系统神经科学的方法:从大型语言模型的结构、输入特征...
1 11 12 13 14 15 23