Jina-VLM:可在笔记本上跑的多语言视觉小模型 ai 搜索公司 jina ai 正式推出全新视觉语言大模型 jina-vlm,该模型拥有 24 亿参数,是当前开源领域中规模达 20 亿级的 vlm 中,在多语言视觉问答任务上表现最为领先的模型。... admin 2025-12-13 12 #编码 #app #macbook #mac #ai #apple #多语言 #大模型 #qwen
AI模型训练从零到精通模型训练的实践方法【教程】 关键在于理清阶段目标、控制变量、快速验证;需区分训练(从零构建基座模型)、微调(用专业数据调整参数)、知识库(外部信息注入推理);动手前选对框架硬件、准备干净小数据集、定好评估方式。 从零开始训练A... admin 2025-12-13 10 #显卡 #字节 #csv #ai #pdf #pytorch #qwen
阿里通义实验室开源 Qwen-Image-i2L 阿里通义实验室正式发布 qwen-image-i2l,支持将任意单张图像即时转换为可训练、可迁移的lora(low-rank adaptation)模型。 无需依赖大规模图像数据集或高性能计算设备,... admin 2025-12-12 11 #apache #编码 #工具 #ai #重绘 #qwen
Omni-Infer v0.7.0 已经发布,超大规模 MoE 模型推理加速技术 Omni-Infer v0.7.0 正式上线,带来面向超大规模混合专家(MoE)模型的高效推理加速能力。 v0.7.0 核心亮点 Omni Cache 新增对 MLA(Multi-Head... admin 2025-12-12 13 #git #docker #ai #gpt #gitee #ultra #deepseek #qwen
通义千问保持 AI 模型领先地位,阿里云 CTO 周靖人晋升阿里合伙人 感谢网友 我是搬运工 的线索提供! 12 月 10 日消息,据《晚点 LatePost》今日披露,阿里云首席技术官、通义实验室负责人周靖人已正式成为阿里巴巴合伙人。推动其晋升的关键因素之一,正是他所带... admin 2025-12-12 12 #计算机 #阿里云 #ai #微软 #自然语言处理 #大模型 #阿里巴巴 #通义千问 #qwen
Qwen3-TTS 全面升级:49 种音色 + 10 种语言 + 9 种方言 阿里通义qwen团队正式推出qwen3-tts语音合成模型的重大版本更新(发布日期:2025年11月27日),该升级聚焦于语音生成的稳定性、自然度与执行效率,目前已全面开放qwen api调用支持。此... admin 2025-12-12 9 #多语言 #api调用 #2025年 #2025 #qwen
DeepSeek 更新了,我更期待量化版 大家好,我是专注 ai 学习的老章 昨天大模型圈异常热闹,其实近期新版本层出不穷,尤其是 Qwen 系列,我也抽空做了一些测试,只是时间有限没来得及出文分享 DeepSeek-V3.1-Terminu... admin 2025-12-09 12 #工具 #ai #gpt #多语言 #gpt-4 #claude #大模型 #deepseek #2025 #本地部署 #qwen