FARS - Analemma（日行迹）

项目简介

FARS (Fully Automated Research System) 是由 Analemma（日行迹）开发的端到端 AI 研究系统，能够全自动完成文献调研、假设生成、代码编写、实验执行、论文撰写等科研全流程。系统由 Ideation（选题）、Planning（规划）、Experiment（实验）、Writing（写作）四个智能体模块构成，在共享文件系统中分工协作，文件系统同时承担工作空间和持久记忆功能。

FARS 的设计基于研究系统的第一性原理：高效、可靠地拓展知识边界。输出以类"短论文"形式呈现，每篇聚焦于一个边界清晰的研究贡献，鼓励报告失败结果，并在论文首页明确标注由 AI 生成。创始人孙天祥是复旦大学 NLP 博士、MOSS 大模型核心主导者，现任上海创智学院助理教授。

应用结果

417 小时产出 166 篇论文

在 160 块 GPU 集群上连续运行 17 天，全自动产出 166 篇 AI 领域学术论文，平均每篇仅需 2 小时 17 分钟，全程无人干预。

成本与规模

总耗资约 18.6 万美元（约 130 万人民币），消耗 216 亿 token，单篇成本约 1,100 美元。全程在官网及多平台直播，并通过 GitLab 实时开源代码。

论文质量验证

经斯坦福 AI 审稿系统 (Stanford Agentic Reviewer) 评审，其中一篇获 5.2/10 评分（Weak Accept），包含完整假设、实验设计、对照组与统计检验，引用 15 篇参考文献。

诚实报告失败

系统诚实报告否定结果（如 VLA 思维收敛指标研究），失败实验本身也被视为有意义的知识贡献。每篇论文上传 arXiv 前经至少 3 位五年以上研究经验的成员质量评估。

完整科研流程复现

以《Local-Time AdamW for Stability-Gap Reduction in Continual Learning》为例：系统自主发现 AdamW 优化器偏差校正在任务切换时的问题，提出仅一行代码的修改，将稳定性间隙降低 17-31%。

GitHub 高频提交

因代码提交频率过高触发 GitHub 频率限制后迁移至 GitLab。GitLab 活动热力图显示：直播期间提交密度远超正常人类研究者水平。

🤖 Agent 自主部署 manifest-ready LightFARS downgrade

注意 — 自动部署降级说明：完整 FARS 需 160+ GPU 的阿里云 PAI-灵骏集群 + 人工审批，Agent 无法自主完成申请。因此 application/agent-deploy+json 清单目标为 LightFARS（单节点轻量版，基于 LangChain 1.0+）。完整集群方案见下方「基于阿里云的部署方案」。

成功判定：run_agent.py 进程存活且日志出现 “FARS Agent initialized” 或研究回合已开始。

📘 完整安装文档（Markdown）：agent-install/fars-agent-install.md — 含 9 章完整流程：前置检查 / 人类输入 / .env 模板 / 按序执行 / 分级验收（L1 import / L2 .env / L3 启动）/ 11 项故障排查 / 停止 / 自定义国内离线 Linux 友好

① 前置条件检查（Agent 自检）

LightFARS 单节点 CPU-only 即可启动，部分实验子模块才需 GPU

python3 --version       # required: 3.10+   git --version           # required   nvidia-smi              # optional

② 需人类补齐（Agent 必须暂停询问）

DASHSCOPE_API_KEY 去通义千问 DashScope 创建 API Key（需开通 qwen-max + text-embedding-v2）

RESEARCH_TOPIC 默认：graph neural network for time series；即某个初始研究方向种子

LIGHTFARS_REPO 默认 https://github.com/q198132/lightfars；如无法访问可改为 fork 地址

③ lightfars/.env 模板（Agent 替换 ${...} 后写入）

LLM_PROVIDER=dashscope   LLM_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1   LLM_API_KEY=${DASHSCOPE_API_KEY}   LLM_MODEL=qwen-max   EMBEDDING_MODEL=text-embedding-v2   RESEARCH_TOPIC=${RESEARCH_TOPIC:-graph neural network for time series}   MAX_ROUNDS=3   OUTPUT_DIR=./outputs   LANGCHAIN_TRACING_V2=false

④ 按序执行命令（Agent 串行跑）

# 1. 克隆 LightFARS   git clone https://github.com/q198132/lightfars.git && cd lightfars      # 2. 虚拟环境   python3 -m venv .venv && source .venv/bin/activate && pip install -U pip      # 3. 安装依赖   pip install -r requirements.txt      # 4. 写入上方 .env（使用人类补齐的 DASHSCOPE_API_KEY）      # 5. 启动 Agent 主循环（后台）   nohup python run_agent.py > lightfars.log 2>&1 &

⑤ 部署成功验证

sleep 8 && pgrep -f run_agent.py && tail -n 30 lightfars.log && echo "✅ LightFARS Agent 已启动"

⑥ 常见故障排查

仓库 q198132/lightfars 不可访问改用 fork 地址；或基于官方 FARS 仓库移除 Kubernetes / Ray / MPI 集群依赖后部署

pip install 很慢pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/

LangChain 版本冲突pip install 'langchain>=1.0' 'langchain-community>=0.3'

DashScope 401 Unauthorized核对 .env 中的 API Key，确认账号已开通 qwen-max 和 text-embedding-v2

想要完整 FARS 160 GPU 集群Agent 无法自主申请 PAI-灵骏（需人工审批），请人类按下方「基于阿里云的部署方案」执行

基于阿里云的部署方案

构建 GPU 算力集群（ECS GPU + PAI-灵骏）

FARS 需要大规模 GPU 集群支撑四个智能体并行工作：

中小规模：在阿里云 GPU 云服务器上创建多台 ecs.gn7实例，组建自管理集群
大规模生产：使用 PAI-灵骏智算服务，提供软硬件一体化的算力集群，自动调度训练/推理任务
参照官方方案：将 GPU 集群包装为训练/推理工具供智能体调用，使智能体免于处理底层 Infra 问题
推荐使用抢占式实例降低长时间运行成本（17 天连续运行场景）

搭建共享文件系统（文件存储 NAS）

FARS 的四个智能体通过共享文件系统协作，这是架构核心：

创建文件存储 NAS 极速型实例（推荐），获得低延迟高吞吐的共享存储
NAS 文件系统同时承担工作空间和持久记忆两个角色
所有 GPU 实例挂载同一个 NAS，确保 Ideation/Planning/Experiment/Writing 四个 Agent 能实时读写同一目录
配合 OSS 对象存储归档已完成的论文、实验代码和日志

配置多模型 API 统一接入（通义千问 + 模型服务）

FARS 需要调用多种大模型完成不同环节：

使用通义千问 DashScope API 作为主力推理模型，支持 Qwen-Max / Qwen-Plus 等多个规格
在 PAI-EAS 上部署开源模型（如 Qwen-72B 等）作为辅助，用于数据合成和 LLM-as-Judge
FARS 提供统一调用端口，只需配置各模型的 API 端点和 Key 即可接入
建议为不同智能体分配不同模型规格，平衡成本与质量

代码托管与 CI/CD（云效 / GitLab）

FARS 会高频提交代码（曾触发 GitHub 频率限制）：

使用云效 Codeup 或自建 GitLab 作为代码仓库，避免公共平台频率限制
配置 CI/CD 流水线，自动对每篇论文的实验代码执行基础测试
实验结果自动归档到 OSS，方便后续复现与审阅

监控与可视化（云监控 + ARMS）

长时间运行需要完善的监控体系：

使用云监控实时追踪 GPU 利用率、内存使用和网络流量
配合 ARMS 应用监控追踪各智能体的运行状态和性能指标
设置告警规则：GPU 利用率过低、磁盘空间不足、Agent 异常退出等场景及时通知
参照官方直播监控大屏，搭建自定义 Grafana Dashboard 展示论文产出、成本统计等业务指标

轻量级体验方案（LightFARS）

如果暂不需要完整集群，可先从轻量版开始：

克隆 LightFARS 仓库（基于 LangChain 1.0+ 的轻量实现）
在单台阿里云 ECS（无需 GPU）上运行，配合通义千问 API 完成核心多智能体协作流程
适合个人研究者快速理解 FARS 架构和验证科研想法