标签:视觉
刷榜13个暗光增强基准!清华大学联合ETH等开源Retinexformer:亮、暗都有细节 | ICCV 2023
Retinexformer架构可以端到端、单阶段解决过曝、伪影、低光等图像增强问题,超越了目前的暗光增强sota模型。该架构基于Retinex理论,但考虑了隐藏在黑暗中或...
大模型的最大bug!回答正确率几乎为零,GPT到Llama无一幸免
近乎为零,甚至还会给出完全错误的答案。这个现象被称为逆转诅咒,是指当模型在训练过程中接收到的数据具有一定的规律性时,模型会过度依赖这些规律性,从而...
大模型的本质及其在游戏行为分析中的应用
本期「中国游戏企业出海周周谈」分享游戏领域内的数据治理、游戏自动化开发、基于LLMs的行为分析新思路等干货内容,分享嘉宾来自完美世界、37手游、亚马逊云...
58标签体系建设实践
本文介绍了58标签体系建设实践,包括痛点及标签建设方案、标签体系和标签管理平台三个模块。文章探讨了业务在何时需要建立标签体系,并分享了相关的建设方案...
多模态大模型最全综述来了!7位微软研究员大力合作,5大主题,成文119页
AI助手总结出的摘要如下:微软华人研究员撰写的综述总结了多模态大模型的研究方向,包括视觉理解、视觉生成、统一视觉模型LLM加持的多模态大模型、多模态agen...
再看文档智能前沿之GeoLayoutLM:一种用于视觉信息提取(VIE)的多模态预训练模型基本原理
2023年9月25日,北京阴天,飞往重庆。GeoLayoutLM是一种用于视觉信息提取的预训练模型,通过几何关系和预训练任务提高文本和布局的特征表示,从而提高文档信...
活动报名 | 图可信学习与图大模型研究进展
9月27日,浙江大学计算机科学与技术学院副教授况琨、北京航空航天大学副教授王啸和浙江大学计算机学院副教授杨洋将在青源会举办活动,分别分享图自监督学习、...
千问的大模型KnowHow
通义千问发布了14B参数的模型,并公开了一份详尽的技术报告,分享了训练8个模型的经验。他们开源的13B模型比SOTA有更好的表现,预训练数据超过3T token。详细...
Nat. Genet. | 深度蛋白质语言模型在基因组范围内预测疾病变异效应
该论文介绍了一个使用ESM1b蛋白质语言模型来预测人类基因编码变异效应的工作流程。尽管最近的深度学习模型在预测准确性方面有所改进,但由于依赖于近源同源物...
JCTC | 新型SiteFerret算法助力蛋白质结合口袋的自动检测
SiteFerret是一种基于几何的口袋预测算法,结合了基于机器学习的排序策略,可用于预测蛋白质活性位点。该算法是一项科学挑战的创新解决方案,能够在口袋预测...