brainrot.js

954 132 较难 1 次阅读 2天前MIT视频语言模型

AI 解读由 AI 自动生成，仅供参考

brainrot.js 是一款充满趣味的开源文本生成视频工具，它能将任意主题的内容转化为当下流行的“脑腐”（Brainrot）风格短视频。其核心特色在于允许用户指定乔丹·彼得森、乔·拜登、唐纳德·特朗普等知名人物的声音进行解说，让学习过程变得既荒诞又生动。

该工具主要解决了传统视频制作中配音角色单一、风格固化以及创意表达受限的问题，为创作者提供了一种快速生成具有强烈网络迷因属性内容的途径。它特别适合对前端开发、AI 应用集成感兴趣的开发者，以及希望探索新型内容形式的自媒体创作者使用。普通用户若想体验，需具备一定的技术基础以完成本地环境配置。

在技术实现上，brainrot.js 展现了独特的架构能力：它基于 Docker 容器化部署，整合了 Groq 的高速推理、OpenAI 的内容生成以及 Speechify 的高拟真语音克隆技术。项目不仅支持常规的一键生成模式，还创新性地提供了"Studio 模式”，允许开发者在不重新渲染视频的情况下，实时编辑代码并预览音频与上下文效果，极大提升了调试与创作效率。需要注意的是，由于依赖项庞大，本地运行需要较高的存储空间和一定的耐心等待构建过程。

使用场景

某教育科技公司的内容运营团队希望将枯燥的“量子力学基础”知识点，转化为能在 TikTok 和 YouTube Shorts 上病毒式传播的短视频，以吸引 Z 世代用户。

没有 brainrot.js 时

制作门槛极高：团队需分别聘请脚本作家、配音演员和视频剪辑师，手动合成特朗普或奥巴马等名人声音不仅成本高昂，还面临严重的版权法律风险。
内容风格脱节：传统科普视频语气严肃，难以融入互联网流行的"Brainrot"（无厘头/梗文化）语境，导致年轻用户完播率极低，无法引发社交传播。
迭代周期漫长：从撰写文案到渲染输出一个 30 秒的视频通常需要数天时间，若需调整某个名人的台词或背景素材，整个流程必须推倒重来，无法快速测试不同创意。

使用 brainrot.js 后

一键生成名人演绎：只需配置 Speechify 和 Groq API 密钥，并在 localBuild.ts 中设定主题，brainrot.js 即可自动调用训练好的乔丹·彼得森或安德鲁·塔特等名人音色，合法合规地生成解说音频。
原生梗文化融合：工具内置的生成逻辑能自动将复杂的物理概念转化为带有强烈个人风格的幽默段子，完美契合短视频平台的算法推荐机制，显著提升用户互动率。
实时工作室模式：利用 MODE=studio 功能，创作者可在不重新渲染视频的情况下，实时修改 src/Composition.tsx 中的代码逻辑并预览效果，将原本数天的制作周期压缩至 20 分钟以内。

brainrot.js 通过将复杂的多模态生成流程封装为简单的本地脚本，让普通开发者也能低成本、高效率地批量生产具有病毒传播潜力的名人恶搞科普视频。

运行环境要求

操作系统

未说明 (需支持 Docker)

GPU

未说明

内存

建议充足存储以容纳约 12.6GB 的 Docker 镜像，具体 RAM 需求未说明

依赖

notes必须安装 Docker。需要配置 Speechify、Groq 和 OpenAI 的 API 密钥。构建 Docker 镜像耗时 5-15 分钟，镜像大小约 5.5GB（常见问题提示可能达 12.6GB），请确保磁盘空间充足。视频生成过程可能需要 10-20 分钟。项目主要使用 Bun 作为包管理器和运行时，而非 Python。

python未说明 (项目使用 Bun 运行时)

Docker

Bun

Speechify API

Groq API

OpenAI API

快速开始

如何在本地运行 👇

您的电脑上必须安装 Docker（https://www.docker.com/get-started/）
在 generate/.env 文件中添加以下内容：

JORDAN_PETERSON_VOICE_ID=您的 Speechify API 密钥在此处
JOE_ROGAN_VOICE_ID=您的 Speechify API 密钥在此处
BARACK_OBAMA_VOICE_ID=您的 Speechify API 密钥在此处
KAMALA_HARRIS_VOICE_ID=您的 Speechify API 密钥在此处
BEN_SHAPIRO_VOICE_ID=您的 Speechify API 密钥在此处
ANDREW_TATE_VOICE_ID=您的 Speechify API 密钥在此处
JOE_BIDEN_VOICE_ID=您的 Speechify API 密钥在此处
DONALD_TRUMP_VOICE_ID=您的 Speechify API 密钥在此处
GROQ_API_KEY=您的 GROQ API 密钥在此处
OPENAI_API_KEY=您的 OpenAI API 密钥在此处
SPEECHIFY_API_KEY=您的 Speechify API 密钥在此处

1.5 请注意，在继续操作之前，您需要获取 GROQ、OpenAI 和 Speechify 的实际 API 密钥值（下方提供了获取这些密钥的链接）。
2. 进入 generate 目录（cd generate），然后运行 chmod +x scripts/start.sh 和 chmod +x scripts/build.sh。这将使脚本具有可执行权限。
3. 现在运行 ./scripts/build.sh 来构建 Docker 镜像。由于依赖项较多，此过程大约需要 5–15 分钟，镜像大小约为 5.5GB。
4. 接着在 ./generate 目录下运行 bun install。
5. 现在您可以运行 ./scripts/start.sh 来启动容器。有两种运行模式：常规模式和工作室模式。常规模式会执行 localBuild.ts 脚本，并在 out 目录中输出视频；而工作室模式也会执行 localBuild.ts 脚本，但不会渲染视频，而是生成视频所需的音频和上下文文件，并在容器外部运行 bun run start。这样您就可以实时编辑视频代码（位于 src/Composition.tsx），并立即看到更新效果。要以工作室模式运行，请执行 MODE=studio ./scripts/start.sh；要以常规模式运行，则直接执行 ./scripts/start.sh。若想更改生成的视频内容，只需修改 localBuild.ts 文件顶部的变量值即可。视频生成过程可能需要 10–20 分钟，请耐心等待！
6. 大功告成！您刚刚制作出了“brainrot”视频。

如何获取 Speechify 凭证：

https://speechify.com/text-to-speech-api/

通过上述链接注册以获得 API 访问权限，然后从 training_audio/ 文件夹中获取特朗普、乔·拜登等人的音频，以便在您的 Speechify 账户上为这些角色训练自定义语音。

如何获取 OpenAI 凭证：

https://platform.openai.com/api-keys

如何获取 Groq API 凭证：

https://console.groq.com/keys

常见问题

您的存储空间不足（镜像大小约为 12.6GB）。


（注：您还可以运行说唱模式，但本说明文档目前尚未介绍具体操作方法。您可以自行探索，稍后我会在此文档中补充相关说明。）

brainrot.js 快速上手指南

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：支持 Docker 的系统 (Linux, macOS, Windows with WSL2)
核心依赖：
- Docker (必须安装)
- Bun (用于运行本地脚本)
API 密钥：您需要提前注册并获取以下服务的 API Key：
- Speechify: 用于语音合成 (需自行训练或获取特定人物声音 ID)
- Groq: 用于快速推理
- OpenAI: 用于内容生成

安装步骤

1. 配置环境变量

在项目根目录下创建 generate/.env 文件，并填入您的 API 密钥和声音 ID：

JORDAN_PETERSON_VOICE_ID=your speechify api key here
JOE_ROGAN_VOICE_ID=your speechify api key here
BARACK_OBAMA_VOICE_ID=your speechify api key here
KAMALA_HARRIS_VOICE_ID=your speechify api key here
BEN_SHAPIRO_VOICE_ID=your speechify api key here
ANDREW_TATE_VOICE_ID=your speechify api key here
JOE_BIDEN_VOICE_ID=your speechify api key here
DONALD_TRUMP_VOICE_ID=your speechify api key here
GROQ_API_KEY=YOUR GROQ API KEY HERE
OPENAI_API_KEY=YOUR OPEN AI API KEY HERE
SPEECHIFY_API_KEY=YOUR SPEECHIFY API KEY HERE

注意：VOICE_ID 字段需要您在 Speechify 平台通过上传 training_audio/ 文件夹中的音频样本进行训练后获取对应的实际 ID。

2. 赋予脚本执行权限

进入 generate 目录并使构建脚本可执行：

cd generate
chmod +x scripts/start.sh
chmod +x scripts/build.sh

3. 构建 Docker 镜像

运行构建脚本。此过程将下载大量依赖，生成的镜像大小约为 5.5GB，耗时约 5-15 分钟：

./scripts/build.sh

4. 安装本地依赖

在 generate 目录下安装 Bun 依赖：

bun install

基本使用

构建完成后，您可以通过两种模式启动项目：

模式一：常规模式 (Regular Mode)

直接生成视频文件。脚本将执行 localBuild.ts，并在 out 目录输出最终视频。整个过程可能需要 10-20 分钟。

./scripts/start.sh

模式二：工作室模式 (Studio Mode)

适用于开发者实时调试。该模式仅生成音频和上下文文件，不渲染最终视频。它允许您在容器外运行 bun run start，从而实时编辑 src/Composition.tsx 中的视频代码并立即预览效果。

MODE=studio ./scripts/start.sh

自定义内容：若要更改生成的视频内容，请修改 localBuild.ts 文件顶部的变量值。

版本历史

v.3.02024/05/15

v.2.02024/04/03

v.1.02024/02/24

常见问题

运行转录脚本时出现 'Cannot find ffprobe' 或 HTTP 500 错误怎么办？

遇到 'ENOENT: no such file or directory, open public/srt/...' 错误如何解决？

在 Windows 上运行 Python 转录脚本时出现模块导入错误或 DLL 丢失怎么办？

出现 'Error: connect ECONNREFUSED 127.0.0.1:3306' 数据库连接错误如何处理？

音频生成失败或出现 ElevenLabs 401/500 错误的原因是什么？

提供了 API Key 但应用仍然无法工作或报错，需要检查哪些配置？

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 147.9k|★★☆☆☆|今天

开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|3天前

语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|3天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|4天前

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.1k|★★☆☆☆|昨天

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|昨天

语言模型数据工具其他