1.Dual Prototype Evolving for Test-Time Generalization of Vision-Language Models...
使用定向边界框(OBB)训练精确的物体检测模型需要一个全面的数据集。本文解释了与Ultralytics YOLO 模型兼容的各种 OBB 数据集格式,深入介绍了...
在本文中,我们创新性地将ACConv2d模块引入到YoloV8目标检测模型中,通过对YoloV8中原有的Conv卷积层进行替换,实现了模型性能的大幅提升。ACC...
DAMODEL(丹摩智算)是专为AI打造的智算云,致力于提供丰富的算力资源与基础设施助力AI应用的开发、训练、部署。
在上一篇文章中完成了前期的准备工作,见链接:RDNet实战:使用RDNet实现图像分类任务(一)前期的工作主要是数据的准备,安装库文件,数据增强方式的讲解,模型...
在上一篇文章中完成了前期的准备工作,见链接:Vision-LSTM实战:使用Vision-LSTM实现图像分类任务(一)前期的工作主要是数据的准备,安装库文件,...
论文链接:https://arxiv.org/pdf/2404.10518 MobileNetV4,作为新一代移动设备神经网络架构,凭借其创新的通用倒置瓶颈UI...
论文链接:https://arxiv.org/pdf/2406.04303 Vision-LSTM(ViL)架构的核心是xLSTM块。每个xLSTM块都包含一个...
在上一篇文章中完成了前期的准备工作,见链接:MobileNetV4实战:使用MobileNetV4实现图像分类任务(一)前期的工作主要是数据的准备,安装库文件,...
在上一篇文章中完成了前期的准备工作,见链接:EfficientVMamba实战:使用EfficientVMamba实现图像分类任务(一)前期的工作主要是数据的准...
mean_std.py:计算mean和std的值。 makedata.py:生成数据集。 train.py:训练Vim模型 models:来源官方代码,对面的代...
本文尝试使用MogaNet改进YoloV8,使用MogaNet的Block替换YoloV8的Block,实现涨点。
本文尝试改进了新的注意力,使用空间注意力和多轴频域注意力融合改进。改进后的注意力超越了GAM、BAM和CBAM等常用的注意力。
SE注意力机制是一种通过显式建模卷积特征的信道之间相互依赖性的方法,旨在提高网络产生的表示的质量。SE注意力机制包括两个步骤:Squeeze和Excitatio...
涨点效果:在我自己的数据集上,改进一的mAP50 由0.986涨到了0.991,mAP50-95由0.737涨到0.753,涨点明显!
涨点效果:在我自己的数据集上,mAP50由原来的0.986涨到0.993,mAP50-95由原来的0.737涨到0.788,涨幅明显
将UniRepLKNet应用到YoloV8的改进中,经过测试,涨点明显,运算量也有下降!
在上一篇文章中完成了前期的准备工作,见链接:TransXNet实战:使用TransXNet实现图像分类任务(一)前期的工作主要是数据的准备,安装库文件,数据增强...
论文提出了一种名为D-Mixer的轻量级双动态TokenMixer,旨在解决传统卷积的静态性质导致的表示差异和特征融合问题。D-Mixer通过应用高效的全局注意...
REFCONV是一种用于构建强大卷积神经网络的重新参数化的重新聚焦卷积(re-parameterized refocusing convolution)。它是一...