Channel Avatar

AIGCLINK @UCtRT9IvTLaR1yipVrSvxM3A@youtube.com

15K subscribers - no pronouns :c

aigc探路者:定制各种企业AI私有化模型咨询及落地


09:01
AI Infra Guard:腾讯发布AI运维专家,老板再也不用担心被偷算力、被偷模型了,支持dify、comfyui、openwebui、langchain等推理和训练框架的安全漏洞检测
14:08
TheoremExplainAgent:AI数理化老师来了,可生成10分钟教学视频给学生讲解数理化、计算机科学,双智能体结构,一个负责备课、写讲稿,一个负责用Manim生成Python动画及音频
16:09
Claude3.7+Cursor+MCP:1、claude发布推理模型claude3.7;2、在cursor中调用MCP服务,实现多个AI员工辅助干活;3、Qwen发布推理模型qwen2.5-max
48:19
MCP协议开启AI员工互联网时代:1、Agent互联网新纪元开启web4.0时代;2、互联网 vs Agent互联变迁;3、实操通过agent浏览器使用AI员工;4、agent浏览器和AI员工未来预测
12:30
Cline MCP MarketPlace:替代人的AI员工人才市场来了,cline开放MCP开源AI应用商店,这次的发布开启了Agent互联网协议的第一步,实实在在吊打封闭式的coze
14:22
MGX:MetaGPT发布全球首个AI软件团队mgx,agent领域的国产之光,可替代初级、中级的软件外包公司,也是继devin、bolt.new之后的首个国产的AI程序员团队agent
21:30
Grok3:马斯克发布全球最强推理模型Grok-3和推理增强的AI搜索,各项基准超越deepseek-r1,采用moe架构、1.8万亿参数、动态激活参数,适合于教育、药物、芯片设计、法律等各种领域
15:01
FOLOUP:开源版的AI面试官来了,可替代人工完成远程AI语音面试,生成完整的面试分析报告,辅助人力资源面试招聘,适用于大规模的蓝领岗位招聘
58:37
Deepseek对agent、rag带来哪些影响?1、deepseek推理能力与AI编程的结合;2、deepseek的推理能力催生推理增强RAG和推理增强agent;3、ds催生大模型+垂直模型新范式
11:16
deepseek-r1本地化:Deepseek-r1满血版本地化部署的坑有哪些?若部署了r1如何快速封装出API提供用户服务,如何基于openwebui做API服务?
16:49
DeepClaude:使用DeepSeek r1的规划能力结合claude的代码执行act,组成史上最强AI程序员助手,发挥出深度思考实际应用;cline+ r1+ claude=史上最强AI程序员
01:02:52
Deepseek为2025年带来哪些变⾰?1、deepseek带来哪些新的趋势和机会?2、对于⼤模型公司有哪些影响?3、对⼤模型应⽤落地定制从业者有哪些影响?4、2025年新的创新点有哪些?
14:35
YuE:基于歌词生成整首歌的开源音乐模型,实现本地化部署音乐模型替代suno.ai,可生成最长5分钟的歌曲,支持中文、英文、粤语、日韩等多国语言
12:47
Deepseek R1深度搜索:只用2.1美元实现基于Deepseek-R1的深度AI搜索,基于cline+claude自动生成AI搜索代码,含深度思考过程
01:51:49
【完整版】Deepseek为开源领域贡献 价值不亚于llama:强化学习准备数据集、MOE+MLA+MTP创新训练架构、算力调配优化等,初步实现AGI实现第二增长曲线
01:10:00
Deepseek为开源领域贡献 价值不亚于llama:强化学习准备数据集、MOE+MLA+MTP创新训练架构、算力调配优化等,初步实现AGI实现第二增长曲线
11:29
Operators:openai发布Computer Use Agent,再次加速了computer use的落地,hr可直接用operators在linkedin自动完成简历筛选
12:02
Compute Use:字节发布新一代原生GUI智能体开源模型UI-TARS;智谱发布的pc端gui智能体glm-pc,实现电脑桌面的任务自动化,智谱和字节共同开启2025年compute use元年
10:19
DeepSeek+Manim教学视频生成:基于DeepSeek-r1-Zero+Manim生成数学教学动画视频,将deepseek的COT思考作为教学内容,然后使用manim生成教学动画视频替代教师
15:22
DeepSeek-R1 :国产大模型的AGI雏形,首个不大量依赖人类数据训练的大模型,且相关性能可以对标 OpenAI o1 正式版,实测roocline+deepseek-reasoner编程能力
27:57
企业大模型应用落地1年多的经验与反思,bisheng作者覃睿-2025年第四届AIGC开发者大会
19:17
MiniMax-01:首个支持400万token上下文的开源大模型,首创lighting attention机制实现,实现逻辑类似于 Streaming-llm,超越qwen2.5-72b成为国产第一
25:39
多模态交互的未来:Agent AI 的发展与挑战,Ten-agent作者普列斯,2025年第四届AIGC开发者大会
27:06
AI产品出海:0-1阶段的GTM策略与实践分享-函子CMO余芯,2025年第四届AIGC中国开发者大会
48:11
2025年第四届AIGC中国开发者大会在北京圆满举行,AIGCLINK发布了2025年AI十大颠覆式行业发展趋势预测、八大渐进式发展趋势预测、11个商业趋势预测、7个范式转移
33:45
Cosmos :英伟达开启通用世界模型的GPT时刻,人类正式从多模态2D进入3D新时代,物理AI的基建初步完成,机器人爆发预计25年底正式开始
14:09
o1 Trend Finder:一款发现实时趋势和商业情报的AI收集工具,可追踪推特、新闻等各种话题,并将趋势推送Slack,可做营销监控、竞品分析、市场研究等
17:54
Story-Adapter:一款不错的长故事转换为动漫可视化AI工具,可根据语义自动生成100帧漫画或动画的分镜图,生成图的一致性比较好,对于做虾仁之类的简易动漫的短剧从业者来说是变现神器
30:18
DeepSeek-V3:首个综合实力可匹敌Llama3.1-405B的国产开源大模型,创新使用FP8、MLA、MOE的大模型,使用deepseek-v3+cline实测代码能力生成全栈应用
17:10
CogAgent-9b:智谱开源最新版、替代rpa的用户界面自动化的GUI Agent,对标claude compute use,能够接受中英文双语的屏幕截图和语言交互,实现自动执行用户界面的交互操作
16:37
Video Analysis:基于Llama3.2 Vision和OpenAI Whisper构建一款AI视频分析工具,可自动提取关键帧、智能识别画面内容,适合用于切片场景的视频帧内容分析切片
14:28
Livekit EOU:使用transformer改进语音对话活动检测VAD,减少 了85% 无意中断对话,使得智能硬件经常打断用户说话的问题可以得到解决,使体验更佳
15:28
AI Legal Agent Team:AI全方位服务的法律团队来了,包含AI法律研究员、AI合同分析师、AI法律策略师,可完成合同审查、法律研究、风险评估、合规性审查、自定义查询等
25:10
Cline+MCP:只用1.8$成功构建替代英语老师的发音纠正Agent,颠覆agent框架、coze等各种AI应用构建,走入新的范式转移:实操 1$实现AI音乐生成应用
19:49
XHS NoteGenerator:1、一键将视频转为优质小红书笔记AI爆款工具,自媒体懒人神器;2、google多模态再次发力:发布whisk、imagefx、vediofx、musicfx
13:01
Ten+Gemini:Gemini的多模态语音、视频理解能力本地化,广泛应用于智能眼镜、智能语音助手等各种场景,可以识别任何看到的场景并且语音回复
22:23
Gemini 2.0:google首次追赶上openai,从此不再说google的gemini无用了,实时语音对话、视频对话、屏幕对话、agent构建、compute use、虚拟现实交互等基建已到位
13:05
Zion:为coze智能体增加商业化变现能力,一键配置解决coze智能体agent无法变现的问题
13:27
coze+Ten Agent:为自己构建的coze智能体增加实时语音对话能力,利好定制化的智能音箱、ai陪伴等相关场景
10:11
ClearVoice:阿里通义开源的语音降噪、语音分离、视听目标说话人提取,场景点:可用于智能音箱拾音降噪处理,可实现会议里目标演讲人录音分离
19:20
flowise+n8n:可视化Agent结合RPA的最佳实践方案,轻松解决企业级RPA流程和大模型agent融合的问题
01:56:50
BISHENG Workflow:最落地的企业级商业化场景wordflow构建平台,最新能力的实操案例及演示,区别于dify和coze的to b类ai应用构建平
13:18
steel-browser:专为 AI Agent和AI应用构建的开源浏览器 API,构建能像人一样有效地与web交互的AI应用程序
11:26
Coze发布AI应用:人人都可以构建具有UI界面的AI应用,基于coze可一站式构建、托管、复制、发布具有UI界面的AI应用,也是继移动互联网APP之后,首次开启的开发者范式转移,实操构建AI写作助手
13:42
Cursor Agent:cursor增加了AI全栈程序员agent的能力,使得cursor=bolt+GitHub copilot的合体,具备AI生成MVP能力平替bolt.new、srcbook
14:49
Srcbook:TypeScript全栈AI程序员来了,比bolt.new、cline、cursor+v0在TypeScript表现更强
17:36
Claude MCP:claude开源数据万能插头MCP协议(模型上下文协议),支持连接外部各种类型数据源、各种函数工具等,打通agent构建的最后一公里,每个公司都可以拥有coze一样的平台
09:38
picMenu:AI在餐饮行业的落地应用(AI可视化餐饮菜单),只需拍一下菜品名称,几秒即可生成对应菜品效果图片,对商家设计菜单,国外旅游点餐不认识菜名的人来说很实用
12:52
DeepSeek-R1-Lite:中国版的o1来了,复制了o1推理scaling law,其在数学、代码及复杂推理任务上媲美 o1-preview,并展现了o1没有公开的完整思考COT过程,未来将开源
16:18
TEN-Agent:构建智能音箱、AI外呼的实时语音Agent来了,全球首个集成 OpenAI Realtime和RTC的实时语音多模交互Agent,具有天气检查、网络搜索、视听和 RAG 功能等能力
18:04
Pixtral Large-124B:mistral开源124b参数多模态大模型,其在多语言OCR、推理、图表理解等方面表现卓越,同时发布了le Chat,支持PDF理解、AI Agent、图片生成等
41:02
【独家精品】2024年大模型落地应用发展现状及2025年大模型应用发展趋势预测(AIGCLINK年度独家出品)
12:25
logocreator:AI几秒钟创建一个logo,基于flux构建的ai生成logo,用bolt替代品windsurf增加个stripe付费功能,直接可以变现
23:37
bolt.new-any-llm+ollama:本地化AI程序员Agent来了,本地替代v0-cursor不是问题,产品经理有了这个工具就是个研发团队,实战创建一个站点
23:22
OpenWebUI:本地化、自托管的AI应用构建及服务提供开源框架,人人都可以在本地实现ChatGPT、AI搜索、实时自定义语音聊天、artifacts能力等
12:42
Qwen2.5-Coder:阿里通义千问开源性能达到GPT-4o的编程专用模型,具备artifact能力、以及结合cursor使用qwen2.5-coder
14:47
OpenHands:15个代码agent组成的AI程序员,涵盖了人类开发者所有操作:写代码、修改代码、运行命令、浏览网页、调用 API、 从StackOverflow 复制代码片段
07:59
WhoDB:轻量级、支持自然语言交互的text2sql的数据库管理工具,支持PostgreSQL、MySQL、SQLite3、MongoDB、Redis、 ElasticSearch等
15:03
Fish Agent:零样本克隆声音、支持8种语言的TTS语音对话Agent,实现实时、带情感的语音对话,让每个人都可以拥有陪伴类克隆分身,服务特殊人群
15:48
claude-3.5-sonnet:干翻市场已有的PDF解析器和OCR解析器,适用于分析理解各种图表和表格、提取文档的结构化信息,大大促进AI文档处理的准确率