FARS — 全自动科研系统
💡 建议配合 学习模式 使用本工具 学术合规

FARS (Fully Automated Research System) 是由 Analemma(日行迹)开发的端到端 AI 研究系统,能够全自动完成文献调研、假设生成、代码编写、实验执行、论文撰写等科研全流程。系统由 Ideation(选题)、Planning(规划)、Experiment(实验)、Writing(写作)四个智能体模块构成,在共享文件系统中分工协作,文件系统同时承担工作空间和持久记忆功能。


FARS 的设计基于研究系统的第一性原理:高效、可靠地拓展知识边界。输出以类"短论文"形式呈现,每篇聚焦于一个边界清晰的研究贡献,鼓励报告失败结果,并在论文首页明确标注由 AI 生成。创始人孙天祥是复旦大学 NLP 博士、MOSS 大模型核心主导者,现任上海创智学院助理教授。

417 小时产出 166 篇论文

在 160 块 GPU 集群上连续运行 17 天,全自动产出 166 篇 AI 领域学术论文,平均每篇仅需 2 小时 17 分钟,全程无人干预。

成本与规模

总耗资约 18.6 万美元(约 130 万人民币),消耗 216 亿 token,单篇成本约 1,100 美元。全程在官网及多平台直播,并通过 GitLab 实时开源代码。

论文质量验证

经斯坦福 AI 审稿系统 (Stanford Agentic Reviewer) 评审,其中一篇获 5.2/10 评分(Weak Accept),包含完整假设、实验设计、对照组与统计检验,引用 15 篇参考文献。

诚实报告失败

系统诚实报告否定结果(如 VLA 思维收敛指标研究),失败实验本身也被视为有意义的知识贡献。每篇论文上传 arXiv 前经至少 3 位五年以上研究经验的成员质量评估。

完整科研流程复现

以《Local-Time AdamW for Stability-Gap Reduction in Continual Learning》为例:系统自主发现 AdamW 优化器偏差校正在任务切换时的问题,提出仅一行代码的修改,将稳定性间隙降低 17-31%。

GitHub 高频提交

因代码提交频率过高触发 GitHub 频率限制后迁移至 GitLab。GitLab 活动热力图显示:直播期间提交密度远超正常人类研究者水平。

注意 — 自动部署降级说明:完整 FARS 需 160+ GPU 的阿里云 PAI-灵骏集群 + 人工审批,Agent 无法自主完成申请。因此 application/agent-deploy+json 清单目标为 LightFARS(单节点轻量版,基于 LangChain 1.0+)。完整集群方案见下方「基于阿里云的部署方案」。

成功判定run_agent.py 进程存活且日志出现 “FARS Agent initialized” 或研究回合已开始。

① 前置条件检查(Agent 自检)

LightFARS 单节点 CPU-only 即可启动,部分实验子模块才需 GPU
python3 --version       # required: 3.10+   git --version           # required   nvidia-smi              # optional

② 需人类补齐(Agent 必须暂停询问)

DASHSCOPE_API_KEY 通义千问 DashScope 创建 API Key(需开通 qwen-max + text-embedding-v2)
RESEARCH_TOPIC 默认:graph neural network for time series;即某个初始研究方向种子
LIGHTFARS_REPO 默认 https://github.com/q198132/lightfars;如无法访问可改为 fork 地址

③ lightfars/.env 模板(Agent 替换 ${...} 后写入)

LLM_PROVIDER=dashscope   LLM_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1   LLM_API_KEY=${DASHSCOPE_API_KEY}   LLM_MODEL=qwen-max   EMBEDDING_MODEL=text-embedding-v2   RESEARCH_TOPIC=${RESEARCH_TOPIC:-graph neural network for time series}   MAX_ROUNDS=3   OUTPUT_DIR=./outputs   LANGCHAIN_TRACING_V2=false

④ 按序执行命令(Agent 串行跑)

# 1. 克隆 LightFARS   git clone https://github.com/q198132/lightfars.git && cd lightfars      # 2. 虚拟环境   python3 -m venv .venv && source .venv/bin/activate && pip install -U pip      # 3. 安装依赖   pip install -r requirements.txt      # 4. 写入上方 .env(使用人类补齐的 DASHSCOPE_API_KEY)      # 5. 启动 Agent 主循环(后台)   nohup python run_agent.py > lightfars.log 2>&1 &

⑤ 部署成功验证

sleep 8 && pgrep -f run_agent.py && tail -n 30 lightfars.log && echo "✅ LightFARS Agent 已启动"
⑥ 常见故障排查
仓库 q198132/lightfars 不可访问改用 fork 地址;或基于官方 FARS 仓库移除 Kubernetes / Ray / MPI 集群依赖后部署
pip install 很慢pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
LangChain 版本冲突pip install 'langchain>=1.0' 'langchain-community>=0.3'
DashScope 401 Unauthorized核对 .env 中的 API Key,确认账号已开通 qwen-max 和 text-embedding-v2
想要完整 FARS 160 GPU 集群Agent 无法自主申请 PAI-灵骏(需人工审批),请人类按下方「基于阿里云的部署方案」执行
    1

    构建 GPU 算力集群(ECS GPU + PAI-灵骏)

    FARS 需要大规模 GPU 集群支撑四个智能体并行工作:

    • 中小规模:在 阿里云 GPU 云服务器 上创建多台 ecs.gn7实例,组建自管理集群
    • 大规模生产:使用 PAI-灵骏智算服务,提供软硬件一体化的算力集群,自动调度训练/推理任务
    • 参照官方方案:将 GPU 集群包装为训练/推理工具供智能体调用,使智能体免于处理底层 Infra 问题
    • 推荐使用抢占式实例降低长时间运行成本(17 天连续运行场景)
    2

    搭建共享文件系统(文件存储 NAS)

    FARS 的四个智能体通过共享文件系统协作,这是架构核心:

    • 创建 文件存储 NAS 极速型实例(推荐),获得低延迟高吞吐的共享存储
    • NAS 文件系统同时承担工作空间持久记忆两个角色
    • 所有 GPU 实例挂载同一个 NAS,确保 Ideation/Planning/Experiment/Writing 四个 Agent 能实时读写同一目录
    • 配合 OSS 对象存储 归档已完成的论文、实验代码和日志
    3

    配置多模型 API 统一接入(通义千问 + 模型服务)

    FARS 需要调用多种大模型完成不同环节:

    • 使用 通义千问 DashScope API 作为主力推理模型,支持 Qwen-Max / Qwen-Plus 等多个规格
    • PAI-EAS 上部署开源模型(如 Qwen-72B 等)作为辅助,用于数据合成和 LLM-as-Judge
    • FARS 提供统一调用端口,只需配置各模型的 API 端点和 Key 即可接入
    • 建议为不同智能体分配不同模型规格,平衡成本与质量
    4

    代码托管与 CI/CD(云效 / GitLab)

    FARS 会高频提交代码(曾触发 GitHub 频率限制):

    • 使用 云效 Codeup 或自建 GitLab 作为代码仓库,避免公共平台频率限制
    • 配置 CI/CD 流水线,自动对每篇论文的实验代码执行基础测试
    • 实验结果自动归档到 OSS,方便后续复现与审阅
    5

    监控与可视化(云监控 + ARMS)

    长时间运行需要完善的监控体系:

    • 使用 云监控 实时追踪 GPU 利用率、内存使用和网络流量
    • 配合 ARMS 应用监控 追踪各智能体的运行状态和性能指标
    • 设置告警规则:GPU 利用率过低、磁盘空间不足、Agent 异常退出等场景及时通知
    • 参照官方直播监控大屏,搭建自定义 Grafana Dashboard 展示论文产出、成本统计等业务指标
    6

    轻量级体验方案(LightFARS)

    如果暂不需要完整集群,可先从轻量版开始:

    • 克隆 LightFARS 仓库(基于 LangChain 1.0+ 的轻量实现)
    • 在单台阿里云 ECS(无需 GPU)上运行,配合通义千问 API 完成核心多智能体协作流程
    • 适合个人研究者快速理解 FARS 架构和验证科研想法

AI·RESEARCH·HUB — FARS — 全自动科研系统