标签:视觉
20个典型视觉检测案例!
该文章介绍了机器视觉在多个领域的应用案例,包括打印机透明塑胶检测、智能卡OCR字符检测、电池产品定位检测、锂电池极片检测系统和LCD印刷电路定位检测。其...
首个快速知识蒸馏的视觉框架:ResNet50 80.1%精度,训练加速30%
该篇文章是关于快速知识蒸馏(FKD)的研究,来自卡耐基梅隆大学等单位,发表于ECCV 2022。研究旨在提高知识蒸馏的效率和准确性,通过蒸馏带有标签的大模型到...
Kaggle LLM Science 赛题高分思路
Kaggle举办了一个自然语言处理和大模型竞赛,名为LLM Science Exam,参赛者需要使用LLM回答一些困难的问题。随着大型语言模型能力范围的扩大,越来越多的研究...
多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解
摘要:本方案提出了一种自视图融合网络(Self-view Fusion Network),旨在解决点云补全任务中的两个挑战:生成真实的全局形状和高精度的局部结构。该网络利用...
无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步
本文介绍了计算机视觉中的目标检测任务,与图像分类/识别任务不同,目标检测需要模型给出目标的位置和大小信息。目标检测在CV三大任务中处于关键地位。
CVPR 2023 冠军解决方案,零样本异常分割新突破!
CVPR2023冠军解决方案已经实现了零样本异常分割的新突破。本文介绍了Pytorch训练营,以及CV各大方向专栏和各个部署框架的最全教程。此外,还有CV全栈指导班、...
深度学习系统化学习路线图发布了
2023上半年,作者花费六个月时间,系统化整理归纳了深度学习在工业视觉、机器视觉、智能智造行业应用的关键知识点,并基于此构建了一个深度学习系统化学习路...
Firefly 多轮对话微调书生·浦语 InternLM-7B 实践
本文介绍了使用Firefly项目对书生·浦语InternLM-7B进行微调的工作,该项目链接为https://github.com/yangjianxin1/Firefly,模型权重为https://huggingface.c...
蚂蚁集团 x OpenKG 联合发布:新一代《知识语义框架SPG》白皮书
SPG团队在全国知识图谱与语义计算大会上发布了语义增强可编程图谱框架白皮书,该框架可用于构建大规模、高效、可扩展的知识图谱。该框架采用了分层、模块化的...
斯坦福??????-?-??????,迭代生成草图
斯坦福研究人员提出了Sketch-a-Sketch,一种能够将草图转换成高清画作的模型。只需简单的随笔画,比如中世纪城堡或霍比特人房子,模型就能生成美丽的画作。该...