ruilog

AI Agents全栈技术框架综述与未来！
Published : 2025-03-29 Categories : Machine Learning Tags : LLM Agent
LLM Agents正在变得广泛传播，但它们并非轻易就能创造出来，需要许多组件协同工作。以
40+ 张图解
，探索
LLM Agents
的
主要组件
、
Multi-Agent框架、
以及
MCP
...
15种高级RAG技术：从预检索到生成全面提升RAG效果
Published : 2025-03-29 Categories : Machine Learning Tags : RAG LLM
本文主要由文章《15 Advanced RAG Techniques from Pre-Retrieval to Generation》总结并添加了一些自己的理解。
检索增强生成（RAG）是一种强...
一文彻底搞懂大模型 - Dify（Agent + RAG）
Published : 2025-03-29 Categories : Machine Learning Tags : Dify Agent
Dify
Dify 是一个用于构建 AI 应用程序的开源平台。
Dify融合了后端即服务（Backend as Service）和LLMOps理念。它支持多种大型语言模型，如Claude3、OpenA...
Qwen-VL系列多模态大模型技术演进-模型架构、训练方法、数据细节
Published : 2025-03-29 Categories : Machine Learning Tags : Qwen VL VLM
Qwen2.5B-VL-32B开源之际，记录一下Qwen-VL系列多模态大模型技术演进-模型架构、训练方法、数据细节，仅供参考。
系列模型的应用场景：
Qwen-VL：基础图像理解和对话。
Qwen2...
llama.cpp: GGUF格式及模型量化参数介绍
Published : 2025-03-29 Categories : Machine Learning Tags : llama.cpp gguf
GGUF格式介绍
GGUF
（
GPT-Generated Unified Format
）是推理框架
llama.cpp
中使用的一种专为大语言模型设计的二进制文件格式，旨在实现模型的快速加载和保存...
万字长文细说端侧大模型进展(综述)
Published : 2025-03-29 Categories : Machine Learning Tags : LLM
0. 引言
小伙伴们好，我是微信公众号《小窗幽记机器学习》的小编：卖炒米粉的小男孩。最近，智谱AI推出的智能体AutoGLM引起了广泛关注。随着测试的深入，用户对该产品需要将屏幕数据上传至云端所带来的...
全景解读 LLM 后训练技术
Published : 2025-03-29 Categories : Machine Learning Tags : LLM
这篇文章是以2025年2月的一篇综述论文为蓝本，对「LLM后训练技术」的全景讲解：
[2502.21321] LLM Post-Training: A Deep Dive into Reasoning...
万字长文全面解读YOLO的前世今生：从 YOLO-v1 到 YOLO-v12
Published : 2025-03-23 Categories : Machine Learning Tags : Yolo Image
引言
计算机视觉领域中，目标检测技术举足轻重，广泛应用于安防、自动驾驶等关键场景。其中，YOLO 系列模型表现最为卓越。
2015年，YOLOv1横空出世，此后十年，YOLO 系列持续迭代，各版本不断...
DeepSeek 3FS 架构分析和思考（下篇）
Published : 2025-03-20 Categories : Database and Storage Tags : DeepSeek 3FS Storage
在
上篇
中，我们对 3FS 各个组件的实现原理进行了详细分析。这些分析给我们留下一个初步的印象：
3FS 团队的目标并不是要研发一个可以在方方面面达到业界一流水平的全能型产品，更多的是在追求一个限定...
DeepSeek 3FS 架构分析和思考（上篇）
Published : 2025-03-17 Categories : Database and Storage Tags : DeepSeek 3FS Storage
1. 背景
2025 年 2 月 28 日，DeepSeek 在其开源周最后一天压轴发布了自研的并行文件系统 Fire-Flyer File System，简称 3FS。该系统支撑了 DeepSeek...

Categories