标签:视觉
规模法则:生物大小、公司寿命、城市规模都遵循同一套法则丨复杂科学科普视频系列
科学家正在研究的复杂系统,都可能遵循规模法则。规模法则是指,当系统的规模增大时,某些特征会随之按照一定比例变化,这些特征可以是能量消耗、生命寿命、...
GPT-4远不如人类?正确率仅15%,Meta、抱抱脸领衔发布通用AI助手基准GAIA
大型语言模型(LLMs)或许是实现通用人工智能(AGI)的最优解,但评估它们的挑战日益突显。为此,Meta、HuggingFace和AutoGPT的研究团队提出了一个用于测试通...
Chem. Eng. J | 掌控基于ESIPT的AIE效应设计具有单组分白光发射的光学材料
文介绍了一种基于ESIPT的AIE效应控制方法,用于设计单组分白光发射光学材料。中南大学的董界副教授和曾文彬教授是该论文的通讯作者,黄帅博士是第一作者。
大卷积核大有用处 | LSKNet + DiffusionDet更高更强的目标检测模型
本研究探讨了在空域图像分析领域中,物体检测的关键作用,以及使用Transformer和CNN神经网络结构来解决该领域的挑战,如小目标检测和密集元素。Transformer能...
Nat. Mach. Intell.速递:在人工智能中结合神经启发的适应性进行持续学习
本文发表在Nature Machine Intelligence期刊上,题目为“Incorporating neuro-inspired adaptability for continual learning in artificial intelligence”,...
ICCV2023 基准测试:MS-COCO数据集的可靠吗?
ICCV2023会议上的一篇论文“Benchmarking a Benchmark: How Reliable is MS-COCO?”对用于算法比较的MS-COCO数据集的可靠性进行了探讨。数据集在各种任务中都起...
社区供稿 | 图解RoPE旋转位置编码及其特性
RoPE是一种广泛使用的位置编码,但由于计算资源限制,大模型训练时往往只能在较小的上下文长度中进行。为了让大模型在预训练长度之外取得更好的性能,涌现出...
EMNLP2023论文:基于机器翻译模型采用约束束搜索算法生成优化的机器翻译质量评估伪数据
本文介绍了机器翻译质量评估(Quality Estimation, QE)任务,该任务是在没有参考译文的情况下,仅依靠源语句评估机器翻译句子的质量。该任务包括词级别和句...
ACC-UNet | 致敬ConvNeXt,全卷积结构UNet设计,超越SWin-UNet!
前研究工作旨在将传统的卷积神经网络与Transformer相结合,提出了一种新的网络架构Convolutional Transformer Network(CTN)。该架构在医学影像分割任务上进...
DualToken-ViT | 超越LightViT和MobileNet v2,实现更强更快更轻量化的Backbone
自注意力视觉Transformer(ViTs)已成为计算机视觉领域的有竞争力架构。与卷积神经网络(CNNs)不同,ViTs能进行全局信息共享。但其二次复杂性使ViTs计算密集...