Loading... # notebooklm-py:NotebookLM 命令行与 AI Agent 集成工具技术分析 # 一、新闻概述 ## 1. 标题 notebooklm-py:将 Google NotebookLM 搬进命令行的开源神器 ## 2. 发布时间 2025 年 1 月 15 日 ## 3. 来源 微信公众号:痕小子 # 二、核心内容 ## 1. 事件摘要 ### A. 主要内容 GitHub 上新兴的开源项目 notebooklm-py 将 Google NotebookLM 的完整功能搬到了命令行环境中,支持 Claude Skill、CLI 和 Python API 三种使用方式。 ### B. 核心亮点 - 无需打开网页版 NotebookLM,通过命令行完成所有操作 - 支持 URL、PDF、YouTube 视频、Google Drive 等多种数据源 - 一键生成思维导图、音频播客、PPT、测验等学习内容 - 深度集成 Claude Code,可作为 AI Agent 工具使用 ## 2. 关键信息 ### A. 版本信息 - 项目名称:notebooklm-py - 开源平台:GitHub - 作者:teng-lin ### B. 核心能力 - RAG 能力:基于 Gemini 3 Pro 的检索增强生成 - 多模态生成:文本、音频、视频、图表 - 自动化研究:批量处理和可重复研究流程 ### C. 适用人群 - 研究人员、技术写作者 - YouTube 技术视频学习者 - 需要长期知识库管理的用户 - AI Agent 重度用户 ## 3. 背景介绍 ### A. NotebookLM 简介 Google 推出的 NotebookLM 是一款基于 Gemini 3 Pro 的 AI 驱动的研究和学习工具,能够自动从文档、视频中提取关键信息,生成播客、思维导图、PPT 等内容。其 RAG 能力在目前市场上属于第一梯队。 ### B. 痛点分析 网页版 NotebookLM 存在以下限制: - 需要手动操作,缺乏自动化能力 - 无法集成到自动化工作流中 - 批量处理效率低 - 无法作为 AI Agent 的工具使用 # 三、详细报道 ## 1. 主要内容 ### A. 核心功能 AI Agent 工具集成: - 作为 Claude Code Skill 使用 - 支持异步 Python API - 可集成到自定义 AI Agent 研究自动化: - 批量导入多种数据源(URL、PDF、YouTube、Google Drive) - 运行自动化研究查询 - 以编程方式提取见解 - 构建可重复的研究流程 内容生成: - 音频播客(AI 主持的深度对话) - 思维导图 - PPT 演示文稿 - 测验题目 - 抽认卡 - 学习指南 ### B. 技术架构 notebooklm-py 采用分层架构设计,核心层负责与 Google NotebookLM API 交互,接口层提供多种访问方式。 ```mermaid graph TD subgraph Input["输入层"] A[URL源] B[PDF文件] C[Youtube视频] D[Google Drive] end subgraph Core["NotebookLM-Py 核心引擎"] E[认证管理] F[Notebook管理] G[源数据处理] H[AI对话接口] I[内容生成器] end subgraph Output["输出层"] J[思维导图] K[音频播客] L[PPT演示] M[测验题目] N[学习指南] end subgraph Interface["用户接口层"] O[Claude Skill] P[命令行CLI] Q[Python API] end A --> G B --> G C --> G D --> G E --> F F --> G G --> H G --> I H --> O H --> P H --> Q I --> J I --> K I --> L I --> M I --> N O --> H P --> H Q --> H ```  ### C. 安装方式 基础安装: ```bash pip install notebooklm-py ``` 浏览器登录支持(首次认证需要): ```bash pip install "notebooklm-py[browser]" playwright install chromium ``` 通过 Claude Skill 安装: ```bash notebooklm skill install ``` ### D. 三种使用方式 方式一:Claude Skills ```bash # 通过自然语言交互 "制作一个关于量子计算的播客" "将测验下载为markdown格式" "/notebooklm 生成视频" ``` 方式二:命令行界面 ```bash # 首次登录认证 notebooklm login # 创建 notebook notebooklm create "My Research" notebooklm use <notebook_id> # 添加源 notebooklm source add "https://en.wikipedia.org/wiki/Artificial_intelligence" notebooklm source add "./paper.pdf" # 自然语言对话 notebooklm ask "What are the key themes?" # 生成播客 notebooklm generate audio --wait notebooklm download audio ./podcast.mp3 ``` 方式三:Python API ```python import asyncio from notebooklm import NotebookLMClient async def main(): async with await NotebookLMClient.from_storage() as client: # 列出 notebooks notebooks = await client.notebooks.list() # 创建 notebook 并添加源 nb = await client.notebooks.create("Research") await client.sources.add_url(nb.id, "https://example.com") # 对话 result = await client.chat.ask(nb.id, "Summarize this") print(result.answer) # 生成播客 status = await client.artifacts.generate_audio(nb.id) await client.artifacts.wait_for_completion(nb.id, status.task_id) asyncio.run(main()) ``` ## 2. 技术细节 ### A. 功能特性对比 | 功能类别 | 网页版 NotebookLM | notebooklm-py | |---------|-----------------|---------------| | 数据源导入 | 手动上传 | 批量导入,支持自动化 | | 内容生成 | 手动点击 | 命令行/API 调用 | | 播客生成 | 手动操作 | 一键生成 | | 批量处理 | 不支持 | 完全支持 | | AI Agent 集成 | 不支持 | 原生支持 | | 可编程性 | 有限 | 完全可编程 | ### B. 工作流程 ```mermaid sequenceDiagram participant U as 用户 participant C as CLI/API participant N as NotebookLM引擎 participant G as Google服务 U->>C: 发起请求 C->>N: 创建/使用 Notebook C->>N: 添加数据源 N->>G: 上传/解析内容 G-->>N: 返回处理结果 U->>C: 提问/生成指令 C->>N: 调用 AI 接口 N->>G: Gemini 3 Pro 处理 G-->>N: 返回生成内容 N-->>C: 返回结果 C-->>U: 展示/下载内容 ```  ### C. 核心优势 可编程性: - 完整的 Python 异步 API - 支持 CI/CD 集成 - 可构建自动化研究管道 灵活性: - 三种使用方式满足不同场景 - 支持多种数据源 - 可定制化输出格式 效率提升: - 批量处理能力 - 命令行快速操作 - 无需手动点击 ## 3. 数据与事实 ### A. 社区反响 - 在 X(Twitter)上获得多位技术大佬关注和推荐 - GitHub 早期即获得较高关注度和 Star 数 ### B. 技术基础 - 基于 Google NotebookLM API - 使用 Playwright 进行浏览器自动化认证 - Python 异步编程模型 # 四、影响分析 ## 1. 行业影响 ### A. 知识管理趋势 传统的知识管理依赖手动整理和分类,而 notebooklm-py 代表了自动化知识管理的新方向。它将信息处理从手动劳动转变为自动化流水线,是未来知识工作方式的一个缩影。 ### B. AI Agent 生态 该项目展示了 AI Agent 工具生态的繁荣趋势。将优秀 SaaS 产品通过 API/SDK 的方式开放给 AI Agent 使用,将成为未来的重要模式。 ### C. 命令行复兴 在 GUI 产品泛滥的今天,该项目证明了命令行界面的价值。对于 Power User 来说,可编程性和自动化远比华丽的 UI 重要。 ## 2. 用户影响 ### A. 研究人员 - 大幅提升文献调研效率 - 自动化生成学习材料 - 构建可复用的研究流程 ### B. 内容创作者 - 快速将原始素材转化为结构化内容 - 自动生成音频、视频等多媒体内容 - 提高内容产出效率 ### C. 开发者 - 获得强大的 AI 辅助工具 - 可集成到现有工作流 - 降低 AI 应用开发门槛 ### D. 迁移成本 - 网页版用户:零成本切换 - 新用户:需要一定的命令行基础 ## 3. 技术趋势 ### A. RAG 技术普及 NotebookLM 的 RAG 能力是其核心价值,通过开源工具将其普及到更广泛的用户群体,体现了 RAG 技术在知识管理和内容生成领域的重要性。 ### B. AI 原生工具 越来越多的工具开始将 AI 能力作为核心功能,而非附加功能。notebooklm-py 正是这种 AI 原生工具的典型代表。 ### C. 自动化优先 未来的生产力工具将是可编程的、可自动化的。那些能够构建自动化管道的工具将更有价值。 # 五、各方反应 ## 1. 官方回应 Google 官方尚未对 notebooklm-py 发表评论,但该项目使用的是公开 API,属于合规的第三方开发。 ## 2. 业内评价 ### A. 专家观点 该项目填补了 NotebookLM 在自动化和可编程性方面的空白,是 AI 工具生态的重要补充。 ### B. 社区反馈 X 平台上多位技术博主推荐: - 简化了研究工作流 - 与 Claude Code 的集成非常流畅 - 批量处理能力大幅提升效率 ## 3. 用户反馈 ### A. 正面评价 - 命令行操作简洁高效 - Python API 设计优雅 - 大幅提升工作效率 ### B. 关注点 - 首次认证需要浏览器操作 - 依赖 Google NotebookLM 服务稳定性 - 文档相对较新,有待完善 ### C. 潜在改进 - 增加更多输出格式支持 - 提供更详细的 API 文档 - 支持本地部署方案 # 六、相关链接 ## 1. GitHub 仓库 https://github.com/teng-lin/notebooklm-py ## 2. 相关工具 - Google NotebookLM:https://notebooklm.google.com/ - Claude Code:https://claude.ai/code ## 3. 技术文档 - 项目 README 和使用文档 - API 参考文档 *** ## 参考资料 1. [太强了!这个 NotebookLM Skill,真的把 NotebookLM 搬进了命令行!](https://mp.weixin.qq.com/s/Df26BU3lmlBcKIvi5wNZMg) 最后修改:2026 年 01 月 15 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏