首页
编程日记
ChatGpt专题
LINUX学习
Java学习
前端教程
单片机
ESP32
功能测试
轨道融合仿真
正则表达式
图书馆选座系统
dirs 命令
elasticsearch
关键路径
java8新特性
民商法
PDF合并与拆分
aws
iVX低代码平台
codeblock
osg
几何
fastapi
tornado
IO-Link
abaqus
InternVL
2025/2/9 1:14:42
《Mini-internVL》论文阅读:OpenGVLab+清华/南大等开源Mini-InternVL | 1~4B参数,仅用5%参数实现90%性能
论文地址Mini-InternVL: A Flexible-Transfer Pocket Multimodal Model with 5% Parameters and 90% PerformanceGitHub仓库地址模型使用教程和权重下载地址 该论文发表于2024年10月份,截止2024年11月,引用数<10 文章目录 论文摘要1. 引用介绍2. 本文…
阅读更多...
VERA: 基于视觉-语言模型的解释性视频异常检测框架
文章目录 速览摘要01 引言1.1 关键观察与研究问题1.2 我们的方法1.3 贡献 02 相关工作2.1 视频异常检测2.2 针对VLM的语言化学习 03 VERA框架3.1 视频异常检测的任务定义3.2 在VERA中通过语言化学习寻找VAD指导性问题训练目标训练数据通过学习者与优化器更新 Q Q Q学习者与优化…
阅读更多...
论文阅读:InternVL v1.5| How Far Are We to GPT-4V? 通过开源模型缩小与商业多模式模型的差距
论文地址:https://arxiv.org/abs/2404.16821 Demo: https://internvl.opengvlab.com Model:https://huggingface.co/OpenGVLab/InternVL-Chat-V1-5 公开时间:2024年4月29日 InternVL1.5,是一个开源的多模态大型语言模…
阅读更多...