[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-niedev--RTranslator":3,"tool-niedev--RTranslator":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",155373,2,"2026-04-14T11:34:08",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":73,"owner_location":76,"owner_email":77,"owner_twitter":78,"owner_website":73,"owner_url":79,"languages":80,"stars":115,"forks":116,"last_commit_at":117,"license":118,"difficulty_score":32,"env_os":119,"env_gpu":120,"env_ram":121,"env_deps":122,"category_tags":131,"github_topics":133,"view_count":32,"oss_zip_url":73,"oss_zip_packed_at":73,"status":17,"created_at":148,"updated_at":149,"faqs":150,"releases":151},7486,"niedev\u002FRTranslator","RTranslator","Open source real-time translation app for Android that runs locally","RTranslator 是一款专为 Android 设计的开源实时翻译应用，致力于打破语言障碍，让跨语言交流如同母语对话般自然。它主要解决了传统翻译工具依赖网络、隐私安全性低以及无法实现流畅双向实时沟通的痛点。\n\n这款应用非常适合需要出国旅行、与外籍人士面对面交流的普通用户，同时也适合关注数据隐私和技术开源的爱好者使用。其核心亮点在于“完全本地化运行”：依托 Meta 的 NLLB 翻译模型和 OpenAI 的 Whisper 语音识别技术，所有音频处理与翻译均在手机本地完成，无需联网即可保持高质量翻译，从而确保绝对的隐私安全。\n\nRTranslator 提供多种实用模式：“对话模式”支持通过蓝牙连接耳机，实现多人同时在线的双向实时互译，适合深度交谈；“对讲机模式”则仅需一部手机，通过轮流发言快速完成简短问询；此外还包含常规的文本翻译功能。应用支持后台运行，即便在锁屏或使用其他应用时也能持续工作。无论是街头问路还是商务洽谈，RTranslator 都能让你把手机放进口袋，轻松畅享无国界沟通。","\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_f67e6c7be595.png\" width=\"280\">\n\nRTranslator is an (\u003Ca href='https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator?tab=readme-ov-file#libraries-and-models'>almost\u003C\u002Fa>) open-source, free, and offline real-time translation app for Android.\n\nConnect to someone who has the app, connect Bluetooth headphones, put the phone in your pocket and you can have a conversation as if the other person spoke your language.\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n![Conversation mode](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_f3c6fe615ef6.png)\n\u003Cbr \u002F>\u003Cbr \u002F>\n![WalkieTalkie mode and Costs](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_bb83dcce70f1.png)\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Conversation mode\u003C\u002Fh3>\n\nThe Conversation mode is the main feature of RTranslator. In this mode, you can connect with another phone that uses this app. If the user accepts your connection request:\n\n- When you talk, your phone (or the **Bluetooth headset**, if connected) will capture the audio.\n\n- The audio captured will be converted into text and sent to the interlocutor's phone.\n\n- The interlocutors' phone will translate the text received into his language.\n\n- The interlocutors' phone will convert the translated text into audio and will reproduce it from its speaker (or by the Bluetooth headset of the interlocutor if connected to his phone). \n\nAll this in both directions.\n\nEach user can have more than one connected phone so that you can translate conversations between more than two people and in any combination.\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>WalkieTalkie mode\u003C\u002Fh3>\n\nIf conversation mode is useful for having a long conversation with someone, this mode instead is designed for quick conversations, such as asking for information on the street or talking to a shop assistant.\n\nThis mode only translates conversations between two people, it doesn't work with Bluetooth headsets, and you have to talk in turns. It's not a real simultaneous translation, but it can work with **only one phone**.\n\nIn this mode, the smartphone microphone will listen in two languages (selectable in the same screen of the walkie talkie mode) simultaneously. \u003Cbr \u002F>\nThe app will detect in which language the interlocutor is speaking, translate the audio into the other language, convert the text into audio, and then reproduce it from the phone speaker. When the TTS has finished, it will automatically resume listening.\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Text translation mode\u003C\u002Fh3>\n\nThis mode is just a classic text translator, but always useful.\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>General\u003C\u002Fh3>\n\nRTranslator uses \u003Ca href=\"https:\u002F\u002Fai.meta.com\u002Fresearch\u002Fno-language-left-behind\u002F\">Meta\\'s NLLB\u003C\u002Fa> for translation and \u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fwhisper\u002F\">OpenAi\\'s Whisper\u003C\u002Fa> for speech recognition, both are (\u003Ca href='https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator?tab=readme-ov-file#libraries-and-models'>almost\u003C\u002Fa>) open-source and state of the art AIs, have excellent quality and run directly on the phone, ensuring absolute privacy and the possibility of using RTranslator even offline without loss of quality.\n\nAlso, RTranslator works even in the background, with the phone on standby or when using other apps (only when you use Conversation or WalkieTalkie modes). However, some phones limit the power in the background so in that case it is better to avoid it and keep the app open with the screen on.\n\u003Cbr \u002F>\n\n\u003Ca href=\"https:\u002F\u002Fwww.producthunt.com\u002Fposts\u002Frtranslator-2?embed=true&utm_source=badge-featured&utm_medium=badge&utm_souce=badge-rtranslator&#0045;2\" target=\"_blank\">\u003Cimg src=\"https:\u002F\u002Fapi.producthunt.com\u002Fwidgets\u002Fembed-image\u002Fv1\u002Ffeatured.svg?post_id=487672&theme=light\" alt=\"RTranslator - Open&#0045;source&#0032;and&#0032;offline&#0032;simultaneous&#0032;translator&#0032;for&#0032;Android | Product Hunt\" style=\"width: 250px; height: 54px;\" width=\"250\" height=\"54\" \u002F>\u003C\u002Fa>\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Download\u003C\u002Fh3>\n\nTo install the app, download the latest version of the app apk file from https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Freleases\u002F and install it (ignore the other files, those will be downloaded automatically by the app on the first start).\n\n\u003Ca href='https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Freleases'>\u003Cimg alt='Get it on GitHub' src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_b6dd6cedc62f.png' style=\"width: 180px; height: 58px;\" \u002F>\u003C\u002Fa>\n\nOn the first launch, RTranslator will automatically download the models for translation and speech recognition (1.2GB) and once done you can start translating.\n\nThe initial download will get the models from GitHub, however \u003Ca href=\"https:\u002F\u002Fwww.reddit.com\u002Fr\u002FChina\u002Fcomments\u002Fv8fv0p\u002Fwhy_is_github_so_slow_in_china_recently\u002F\">in some regions GitHub is very slow\u003C\u002Fa>, those who have problems of this kind can download the models separately from a computer (or in general in whatever way they prefer) and insert them manually into the app following \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FSideloading.md\">this guide\u003C\u002Fa>.\n\nIf you have a GitHub account and want to be notified when a new release comes out you can do so by clicking, at the top of the page, on \"Watch\" -> \"Custom\" -> \"Releases\" -> \"Apply\".\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>RTranslator 3.0 Coming Soon!\u003C\u002Fh3>\n\nThe 3.0 version of RTranslator will be funded through the [NGI Mobifree Fund](https:\u002F\u002Fnlnet.nl\u002Fmobifree), a fund established by [NLnet](https:\u002F\u002Fnlnet.nl).\n\nMain changes of this version:\n- The NLLB translation model will be replaced with the option to choose between: Mozilla Bergamot models, Madlad 400 3B, and HY-MT 1.5 1.8B. All these models have better translation quality than NLLB 54B, similar to Google Translate (with HY-MT 1.5 1.8B having much better scores than Google Translate).\n- MLKit will be replaced, making RTranslator 100% open source.\n- Various techniques will be added to improve translation quality, including: beam search, multilingual dictionaries, Tatoeba integration, and more.\n- The app will be released on Play Store and F-Droid.\n- A self-hosted web version of the app for text translation using Mozilla models will be made available.\n\nThe first beta of this version will be released between April and June 2026. Stay tuned 🚀\n\n\u003Cimg src=\"https:\u002F\u002Fnlnet.nl\u002Flogo\u002Fbanner.svg\" width=\"200px\">\n\u003Cbr \u002F>\n\n\u003Ch3>What's new in version 2.1\u003C\u002Fh3>\n\n- **New GUI!** Designed by [Chiara Chindamo](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fchiara-chindamo-946053234\u002F).\n\n- Added speak and copy buttons to the text translation mode.\n\n- Added the option to manually control the mics in WalkieTalkie mode.\n\n- Added the option to use low-quality languages.\n\n- Fixed some bugs.\n\nFor the full list of changes see [here](https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Freleases\u002Ftag\u002F2.1.0).\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Performance requirements\u003C\u002Fh3>\n\nI have optimized the AI models a lot to minimize RAM consumption and execution time, despite this however to be able to use the app without the risk of crashing you need a phone with at least **6GB of RAM**, and to have a good enough execution time you need a phone with a fast enough CPU.\n\nIf you have a pretty crappy phone (or if you want maximum speed) you can always use \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Ftree\u002Fv1.00\">version 1.0 of RTranslator\u003C\u002Fa> (but since it uses Google APIs it's not free and needs some initial setup).\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>Supported languages\u003C\u002Fh3>\n\nThe languages supported are as follows:\n\nArabic, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Finnish, French, Galician,  German, Greek, Italian, Japanese, Korean, Macedonian, Polish, Portuguese, Romanian, Russian, Slovak, Spanish, Swedish, Tamil, Thai, Turkish, Ukrainian, Urdu, Vietnamese.\n\u003Cbr \u002F>\u003Cbr \u002F>\nIf your language is not on the list, from version 2.1 of RTranslator you can go into the settings and enable \"**Support low quality languages**\" to add the following languages (which have lower quality for translation and speech recognition):\n\nAfrikaans, Akan (only text), Amharic, Assamese, Bambara (only text), Bangla, Bashkir, Basque, Belarusian, Bosnian, Dzongkha (only text), Esperanto (only text), Estonian, Ewe (only text), Faroese, Fijian (only text), Georgian, Guarani (only text), Gujarati, Hausa, Hebrew, Hindi, Hungarian, Irish (only text), Javanese (only text), Kannada, Kashmiri (only text), Kazakh, Kikuyu (only text), Kinyarwanda (only text), Korean, Kyrgyz (only text), Lao, Limburghish (only text), Lingala, Lithuanian, Luxembourghish, Macedonian, Tagalog (only text), Tibetan.\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>Text To Speech\u003C\u002Fh3>\n\nTo speak, RTranslator uses the system TTS of your phone, so the quality of the latter and the supported languages ​​depend on the system TTS of your phone.\n\nThe supported languages ​​seen above are all compatible with \u003Ca href=\"https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.android.tts&pcampaignid=web_share\">Google TTS\u003C\u002Fa>, which is the recommended TTS (although you can use the TTS you want).\n\nTo change the system TTS (and therefore the TTS used by RTranslator), download the TTS you want to use from the Play Store, or from the source you prefer, and open RTranslator, then open its settings (top right) and, in the \"Output\" section, click on \"Text to Speech\", at this point the system settings will open in the section where you can select the preferred system TTS engine (among those installed), at this point, if you have changed the preferred engine, restart RTranslator to apply the changes (close it from the recent apps and then reopen it).\n\n**Note:** If after that the TTS doesn't work, you can clear the cache of RTranslator and the TTS from Android Applications settings, reboot the phone and retry.\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Privacy\u003C\u002Fh3>\n\nPrivacy is a fundamental right. That's why RTranslator does not collect any personal data (I don't even have a server). For more information, read the \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002Fprivacy\u002FPrivacy_Policy_en.md\" target=\"_blank\" rel=\"noopener noreferrer\">privacy policy\u003C\u002Fa> (for now is the same privacy policy of RTranslator 1.0, but I will update it in the future).\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Libraries and models\u003C\u002Fh3>\n\nRTranslator code is completely open-source, but some of the external libraries it uses have less permissive licenses, these are all the external libraries used by the app (with the indication of their license):\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FBluetoothCommunicator\">BluetoothCommunicator\u003C\u002Fa> (open-source): Used for Bluetooth LE communication between devices.\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FGalleryImageSelector\">GalleryImageSelector\u003C\u002Fa> (open-source): Used for selecting and cropping the profile image from the gallery.\n\n[OnnxRuntime](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fonnxruntime) (open-source): Used as an accelerator engine for the AI models.\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fgoogle\u002Fsentencepiece\">SentencePiece\u003C\u002Fa> (open-source): Used for tokenization of the input text for NLLB.\n\n\u003Ca href=\"https:\u002F\u002Fdevelopers.google.com\u002Fml-kit\u002Flanguage\u002Fidentification\">Ml Kit\u003C\u002Fa> (closed-source): Used for the identification of the language in the WalkieTalkie mode.\n\u003Cbr \u002F>\u003Cbr \u002F>\nAnd the following AI models:\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Ffairseq\u002Ftree\u002Fnllb\">NLLB\u003C\u002Fa> (open-source, but only for non-commercial use): The model used is NLLB-Distilled-600M with KV cache.\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fopenai\u002Fwhisper\">Whisper\u003C\u002Fa> (open-source): The model used is Whisper-Small-244M with KV cache.\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Performance of the models\u003C\u002Fh3>\n\nI converted both NLLB and Whisper to onnx format and quantized them in int8 (excluding some weights to ensure almost zero quality loss), I also separated some parts of the models to reduce RAM consumption (without this separation some weights were duplicated at runtime consuming more RAM than expected) and done other optimizations to reduce execution time.\n\nHere are the results of my optimizations:\n\n|         | normal NLLB onnx model \u003Cbr \u002F>(full int8, no kv-cache)  | RTranslator NLLB onnx model \u003Cbr \u002F> (partial int8, with kv-cache, separated parts)  |\n|---------| ------------------------------------------- | ---------------------------------------------------------- |\n|RAM Consumption| 2.5 GB  | 1.3GB &nbsp;&nbsp;(1.9x improvement)  |\n|Execution time for 75 tokens| 8s  | 2s &nbsp;&nbsp;(4x improvement)  |\n\n|         | Whisper onnx model optimized with [Olive](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FOlive) \u003Cbr \u002F> (full int8, with kv-cache)  | RTranslator Whisper onnx model \u003Cbr \u002F> (partial int8, with kv-cache, separated parts)  |\n|---------| -------------------------------------------------------------- | ------------------------------------------------------------- |\n|RAM Consumption| 1.4 GB  | 0.9 GB &nbsp;&nbsp;(1.5x improvement)|\n|Execution time for 11s audio| 1.9s  | 1.6s &nbsp;&nbsp;(1.2x improvement)|\n\n**N.B.** RTranslator Whisper model can also consume 0.5 GB of RAM but with an execution time of 2.1s (this mode is used for phones with less than 8 GB of RAM)\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Donations\u003C\u002Fh3>\n\nThis is an open-source and completely ad-free app, I don't make any money from it.\n\nSo, if you like the app and want to say thank you and support the project, you can make a donation by clicking on one of the the buttons below (any amount is well accepted).\n\n[![ko-fi](https:\u002F\u002Fwww.ko-fi.com\u002Fimg\u002Fgithubbutton_sm.svg)](https:\u002F\u002Fko-fi.com\u002Fniedev)\n\n\u003Ca href='https:\u002F\u002Fwww.paypal.com\u002Fdonate\u002F?business=3VBKS3WC6AFHN&no_recurring=0&currency_code=EUR'>\u003Cimg alt='Donate' src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_986e43ca906f.png' style=\"width: 190px; height: 80px;\" \u002F>\u003C\u002Fa>\n\nIn case you will donate, or just live a star, thank you :heart:\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>Connected external projects\u003C\u002Fh3>\n\nTake a look at these awesome projects that use RTranslator code:\n\n[**WhisperIMEplus**](https:\u002F\u002Fgithub.com\u002Fwoheller69\u002FwhisperIMEplus)\n\n[**WhisperJET**](https:\u002F\u002Fgithub.com\u002Feix128\u002FWhisperJET)\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>Contributions\u003C\u002Fh3>\n\nIf you want to contribute to this project, first of all, thank you 🚀\n\nIf you don't know where to start, go check the [to-do list](https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FTODO_LIST.md), and in any case, before starting, read the [contribution guidelines](https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FCONTRIBUTING.md).\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>Bugs and problems\u003C\u002Fh3>\nI remind you that the app is still in beta. The bugs found are the following:\n\n- Sometimes the Bluetooth connection drops.\n\nIf you have found any bug please report it by opening an issue, or by writing an email to contact.niedev@gmail.com\n\u003Cbr \u002F>\u003Cbr \u002F>\n\nEnjoy your simultaneous translator.\n","\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_f67e6c7be595.png\" width=\"280\">\n\nRTranslator是一款（\u003Ca href='https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator?tab=readme-ov-file#libraries-and-models'>几乎\u003C\u002Fa>）开源、免费且支持离线的Android实时翻译应用。\n\n只需连接到另一台安装了该应用的手机，再戴上蓝牙耳机，把手机放进口袋，你就能像对方说你的语言一样顺畅地进行对话。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n![对话模式](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_f3c6fe615ef6.png)\n\u003Cbr \u002F>\u003Cbr \u002F>\n![对讲机模式与费用](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_bb83dcce70f1.png)\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>对话模式\u003C\u002Fh3>\n\n对话模式是RTranslator的核心功能。在此模式下，你可以与另一部使用该应用的手机建立连接。如果对方接受你的连接请求：\n\n- 当你说话时，你的手机（或已连接的**蓝牙耳机**）会捕捉音频。\n\n- 捕捉到的音频会被转换成文本，并发送到对方的手机上。\n\n- 对方的手机会将接收到的文本翻译成其目标语言。\n\n- 然后，对方的手机会将翻译后的文本再次转换为语音，并通过其扬声器播放出来（或者通过对方手机连接的蓝牙耳机播放）。\n\n这一过程在双方之间同时进行。\n\n每个用户可以连接多台设备，因此你可以实现多于两个人之间的任意组合的多语种对话。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>对讲机模式\u003C\u002Fh3>\n\n如果对话模式适合长时间交谈，那么对讲机模式则更适合快速交流，比如在街上问路或与店员沟通。\n\n此模式仅适用于两人之间的对话，不支持蓝牙耳机，且需要轮流发言。它并非真正的同声传译，但只需要**一部手机**即可使用。\n\n在这种模式下，智能手机的麦克风会同时监听两种语言（可在对讲机模式界面中选择）。\u003Cbr \u002F>\n应用会检测对方正在使用的语言，将其翻译成另一种语言，再将文本转为语音并从手机扬声器中播放出来。当TTS播放完毕后，系统会自动重新开始监听。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>文本翻译模式\u003C\u002Fh3>\n\n此模式只是一个经典的文本翻译工具，但同样实用。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>通用信息\u003C\u002Fh3>\n\nRTranslator采用\u003Ca href=\"https:\u002F\u002Fai.meta.com\u002Fresearch\u002Fno-language-left-behind\u002F\">Meta的NLLB\u003C\u002Fa>进行翻译，用\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fwhisper\u002F\">OpenAI的Whisper\u003C\u002Fa>进行语音识别。这两者都是（\u003Ca href='https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator?tab=readme-ov-file#libraries-and-models'>几乎\u003C\u002Fa>）开源的最先进的人工智能模型，具有卓越的质量，并且可以直接在手机上运行，从而确保绝对的隐私，并允许在离线状态下使用RTranslator而不会损失质量。\n\n此外，RTranslator即使在后台运行、手机处于待机状态或同时使用其他应用时也能正常工作（仅限于使用对话模式或对讲机模式时）。不过，部分手机会对后台运行的资源有所限制，在这种情况下最好避免让应用进入后台，而是保持屏幕开启并让应用始终处于前台。\n\u003Cbr \u002F>\n\n\u003Ca href=\"https:\u002F\u002Fwww.producthunt.com\u002Fposts\u002Frtranslator-2?embed=true&utm_source=badge-featured&utm_medium=badge&utm_souce=badge-rtranslator&#0045;2\" target=\"_blank\">\u003Cimg src=\"https:\u002F\u002Fapi.producthunt.com\u002Fwidgets\u002Fembed-image\u002Fv1\u002Ffeatured.svg?post_id=487672&theme=light\" alt=\"RTranslator - 开源且离线的Android同声传译器 | Product Hunt\" style=\"width: 250px; height: 54px;\" width=\"250\" height=\"54\" \u002F>\u003C\u002Fa>\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>下载\u003C\u002Fh3>\n\n要安装该应用，请从https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Freleases\u002F下载最新版本的APK文件并进行安装（请忽略其他文件，这些文件会在首次启动时由应用自动下载）。\n\n\u003Ca href='https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Freleases'>\u003Cimg alt='在GitHub获取' src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_b6dd6cedc62f.png' style=\"width: 180px; height: 58px;\" \u002F>\u003C\u002Fa>\n\n首次启动时，RTranslator会自动下载翻译和语音识别所需的模型（约1.2GB），下载完成后即可开始翻译。\n\n初始下载会从GitHub获取模型，然而\u003Ca href=\"https:\u002F\u002Fwww.reddit.com\u002Fr\u002FChina\u002Fcomments\u002Fv8fv0p\u002Fwhy_is_github_so_slow_in_china_recently\u002F\">在某些地区GitHub访问速度较慢\u003C\u002Fa>,遇到此类问题的用户可以从电脑上单独下载这些模型（或以任何他们喜欢的方式下载），然后按照\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FSideloading.md\">本指南\u003C\u002Fa>手动导入到应用中。\n\n如果你拥有GitHub账号，并希望在新版本发布时收到通知，可以在页面顶部点击“Watch” -> “Custom” -> “Releases” -> “Apply”来设置提醒。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>RTranslator 3.0 即将推出！\u003C\u002Fh3>\n\nRTranslator 3.0版本将由[NLnet](https:\u002F\u002Fnlnet.nl)设立的[NGI Mobifree基金](https:\u002F\u002Fnlnet.nl\u002Fmobifree)资助。\n\n该版本的主要更新包括：\n- NLLB翻译模型将被替换为以下选项供用户选择：Mozilla Bergamot模型、Madlad 400 3B以及HY-MT 1.5 1.8B。这些模型的翻译质量均优于NLLB 54B，接近Google Translate水平，其中HY-MT 1.5 1.8B的表现甚至超越了Google Translate。\n- MLKit将被完全移除，使RTranslator成为100%开源应用。\n- 将引入多种提升翻译质量的技术，包括束搜索、多语言词典、Tatoeba集成等。\n- 应用将同时在Play商店和F-Droid上架。\n- 还会推出一个基于Mozilla模型的自托管网页版文本翻译工具。\n\n该版本的首个测试版将于2026年4月至6月间发布。敬请期待🚀\n\n\u003Cimg src=\"https:\u002F\u002Fnlnet.nl\u002Flogo\u002Fbanner.svg\" width=\"200px\">\n\u003Cbr \u002F>\n\n\u003Ch3>2.1版本的新功能\u003C\u002Fh3>\n\n- **全新界面！** 由[Chiara Chindamo](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fchiara-chindamo-946053234\u002F)设计。\n\n- 在文本翻译模式中新增了朗读和复制按钮。\n\n- 在对讲机模式中增加了手动控制麦克风的选项。\n\n- 新增了使用低质量语言的选项。\n\n- 修复了一些bug。\n\n完整变更列表请参见[此处](https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Freleases\u002Ftag\u002F2.1.0)。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>性能要求\u003C\u002Fh3>\n\n我已经对 AI 模型进行了大量优化，以最大限度地减少内存占用和执行时间。尽管如此，为了确保应用在使用过程中不会崩溃，您需要一部至少配备 **6GB 内存** 的手机；而要获得足够快的执行速度，则需要一部 CPU 性能较强的手机。\n\n如果您使用的手机性能较差（或者希望追求极致速度），也可以选择使用 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Ftree\u002Fv1.00\">RTranslator 1.0 版本\u003C\u002Fa>（不过该版本依赖 Google API，因此并非免费，并且需要进行一些初始设置）。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>支持的语言\u003C\u002Fh3>\n\n当前支持的语言如下：\n\n阿拉伯语、保加利亚语、加泰罗尼亚语、中文、克罗地亚语、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、加利西亚语、德语、希腊语、意大利语、日语、韩语、马其顿语、波兰语、葡萄牙语、罗马尼亚语、俄语、斯洛伐克语、西班牙语、瑞典语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语、越南语。\n\u003Cbr \u002F>\u003Cbr \u002F>\n如果您的语言未包含在列表中，从 RTranslator 2.1 版本开始，您可以在设置中启用“**支持低质量语言**”选项，以添加以下语言（这些语言的翻译和语音识别质量相对较低）：\n\n南非语、阿坎语（仅文本）、阿姆哈拉语、阿萨姆语、班巴拉语（仅文本）、孟加拉语、巴什基尔语、巴斯克语、白俄罗斯语、波斯尼亚语、宗喀语（仅文本）、世界语（仅文本）、爱沙尼亚语、埃维语（仅文本）、法罗语、斐济语（仅文本）、格鲁吉亚语、瓜拉尼语（仅文本）、古吉拉特语、豪萨语、希伯来语、印地语、匈牙利语、爱尔兰语（仅文本）、爪哇语（仅文本）、卡纳达语、克什米尔语（仅文本）、哈萨克语、基库尤语（仅文本）、卢旺达语（仅文本）、朝鲜语、吉尔吉斯语（仅文本）、老挝语、林堡语（仅文本）、林加拉语、立陶宛语、卢森堡语、马其顿语、塔加路语（仅文本）、藏语。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>文本转语音\u003C\u002Fh3>\n\nRTranslator 使用您手机的系统 TTS 引擎来进行语音输出，因此其质量和所支持的语言取决于您手机的系统 TTS 配置。\n\n上述支持的语言均与 \u003Ca href=\"https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=com.google.android.tts&pcampaignid=web_share\">Google TTS\u003C\u002Fa> 兼容，这也是推荐使用的 TTS 引擎（当然您也可以选择其他 TTS）。\n\n要更改系统 TTS（进而改变 RTranslator 所使用的 TTS），请从 Play 商店或其他来源下载您想要使用的 TTS 应用，然后打开 RTranslator，进入设置（右上角），在“输出”部分点击“文本转语音”。此时系统会打开 TTS 设置界面，您可以从中选择已安装的首选系统 TTS 引擎。完成选择后，请重启 RTranslator 以使更改生效（从最近应用中关闭后再重新打开）。\n\n**注意：** 如果更改后 TTS 仍无法正常工作，您可以前往 Android 应用管理页面清除 RTranslator 和 TTS 的缓存，重启手机后再试一次。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>隐私政策\u003C\u002Fh3>\n\n隐私权是一项基本权利。因此，RTranslator 不会收集任何个人数据（我甚至没有服务器）。如需了解更多信息，请阅读 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002Fprivacy\u002FPrivacy_Policy_en.md\" target=\"_blank\" rel=\"noopener noreferrer\">隐私政策\u003C\u002Fa>（目前采用的是 RTranslator 1.0 版本的隐私政策，未来我会对其进行更新）。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>库与模型\u003C\u002Fh3>\n\nRTranslator 的代码完全开源，但其中部分外部库采用了较为严格的许可证。以下是应用所使用的全部外部库及其许可证信息：\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FBluetoothCommunicator\">BluetoothCommunicator\u003C\u002Fa>（开源）：用于设备间的蓝牙 LE 通信。\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fniedev\u002FGalleryImageSelector\">GalleryImageSelector\u003C\u002Fa>（开源）：用于从相册中选择并裁剪个人头像。\n\n[OnnxRuntime](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fonnxruntime)（开源）：作为 AI 模型的加速引擎。\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fgoogle\u002Fsentencepiece\">SentencePiece\u003C\u002Fa>（开源）：用于 NLLB 输入文本的分词处理。\n\n\u003Ca href=\"https:\u002F\u002Fdevelopers.google.com\u002Fml-kit\u002Flanguage\u002Fidentification\">Ml Kit\u003C\u002Fa>（闭源）：用于对讲模式中的语言识别。\n\u003Cbr \u002F>\u003Cbr \u002F>\n此外，RTranslator 还使用了以下 AI 模型：\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Ffairseq\u002Ftree\u002Fnllb\">NLLB\u003C\u002Fa>（开源，但仅限非商业用途）：使用的模型为带有 KV 缓存的 NLLB-Distilled-600M。\n\n\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fopenai\u002Fwhisper\">Whisper\u003C\u002Fa>（开源）：使用的模型为带有 KV 缓存的 Whisper-Small-244M。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>模型性能\u003C\u002Fh3>\n\n我将 NLLB 和 Whisper 均转换为 ONNX 格式，并将其量化为 int8 精度（同时保留部分权重以确保几乎无质量损失）。此外，我还对模型的部分组件进行了分离，以降低内存占用（若不进行分离，某些权重会在运行时被重复加载，从而导致内存消耗超出预期），并采取了其他优化措施以缩短执行时间。\n\n以下是优化后的结果对比：\n\n|         | 普通 NLLB ONNX 模型 \u003Cbr \u002F>（全 int8，无 KV 缓存）  | RTranslator NLLB ONNX 模型 \u003Cbr \u002F> （部分 int8，带 KV 缓存，组件分离）  |\n|---------| ------------------------------------------- | ---------------------------------------------------------- |\n|内存占用| 2.5 GB  | 1.3GB &nbsp;&nbsp;（提升 1.9 倍）  |\n|75 个 token 的执行时间| 8s  | 2s &nbsp;&nbsp;（提升 4 倍）  |\n\n|         | 经 [Olive](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002FOlive) 优化的 Whisper ONNX 模型 \u003Cbr \u002F> （全 int8，带 KV 缓存）  | RTranslator Whisper ONNX 模型 \u003Cbr \u002F> （部分 int8，带 KV 缓存，组件分离）  |\n|---------| -------------------------------------------------------------- | ------------------------------------------------------------- |\n|内存占用| 1.4 GB  | 0.9 GB &nbsp;&nbsp;（提升 1.5 倍）|\n|11 秒音频的执行时间| 1.9s  | 1.6s &nbsp;&nbsp;（提升 1.2 倍）|\n\n**注：** RTranslator 的 Whisper 模型还可以将内存占用降至 0.5 GB，但执行时间会延长至 2.1 秒（此模式适用于内存不足 8 GB 的手机）。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>捐赠\u003C\u002Fh3>\n\n这是一款完全开源且无广告的应用，我并未从中获利。\n\n因此，如果您喜欢这款应用并希望表达感谢和支持项目发展，可以通过点击下方按钮进行捐赠（任何金额都将受到欢迎）。\n\n[![ko-fi](https:\u002F\u002Fwww.ko-fi.com\u002Fimg\u002Fgithubbutton_sm.svg)](https:\u002F\u002Fko-fi.com\u002Fniedev)\n\n\u003Ca href='https:\u002F\u002Fwww.paypal.com\u002Fdonate\u002F?business=3VBKS3WC6AFHN&no_recurring=0&currency_code=EUR'>\u003Cimg alt='Donate' src='https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_readme_986e43ca906f.png' style=\"width: 190px; height: 80px;\" \u002F>\u003C\u002Fa>\n\n无论您是否捐赠，或只是给个好评，我都衷心感谢！ :heart:\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\u003Ch3>相关外部项目\u003C\u002Fh3>\n\n请查看这些使用 RTranslator 代码的优秀项目：\n\n[**WhisperIMEplus**](https:\u002F\u002Fgithub.com\u002Fwoheller69\u002FwhisperIMEplus)\n\n[**WhisperJET**](https:\u002F\u002Fgithub.com\u002Feix128\u002FWhisperJET)\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>贡献\u003C\u002Fh3>\n\n如果您想为本项目做出贡献，首先感谢您 🚀\n\n如果您不知道从哪里开始，请查看[待办事项列表](https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FTODO_LIST.md)。无论如何，在开始之前，请先阅读[贡献指南](https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FCONTRIBUTING.md)。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n\n\u003Ch3>错误与问题\u003C\u002Fh3>\n提醒您，该应用目前仍处于测试阶段。已发现的错误如下：\n\n- 有时蓝牙连接会中断。\n\n如果您发现了任何错误，请通过提交问题或发送邮件至 contact.niedev@gmail.com 向我们报告。\n\u003Cbr \u002F>\u003Cbr \u002F>\n\n祝您使用这款同声传译器愉快。","# RTranslator 快速上手指南\n\nRTranslator 是一款专为 Android 设计的开源、免费且支持离线运行的实时翻译应用。它利用 Meta 的 NLLB 模型进行翻译，结合 OpenAI 的 Whisper 进行语音识别，所有计算均在本地完成，确保数据隐私与离线可用性。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**：Android 手机\n- **内存 (RAM)**：至少 **6GB**（低于此配置可能导致应用崩溃）\n- **处理器**：具备较快运算速度的 CPU 以保证实时性\n- **存储空间**：首次启动需下载约 **1.2GB** 的 AI 模型文件\n\n### 前置依赖\n- **TTS 引擎**：推荐使用 **Google TTS** 以获得最佳语音合成效果及语言支持。\n- **网络连接**：首次启动时需要网络以下载模型（若在中国大陆地区访问 GitHub 较慢，建议参考下文“国内加速方案”）。\n- **权限**：需授予麦克风、蓝牙及存储权限。\n\n## 安装步骤\n\n### 1. 下载安装包\n访问官方 Release 页面下载最新版本的 APK 文件：\n```text\nhttps:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Freleases\u002F\n```\n> **注意**：仅需下载 `.apk` 结尾的文件，其他文件会在应用首次运行时自动下载。\n\n### 2. 国内加速方案（可选）\n由于模型文件托管在 GitHub，中国大陆用户下载可能极慢。如遇此情况，可手动下载模型并侧载：\n1. 在电脑端通过加速工具或镜像源下载模型文件。\n2. 参照官方侧载指南将文件放入手机指定目录：\n   ```text\n   https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FSideloading.md\n   ```\n3. 安装 APK 后，应用将直接读取本地模型，无需在线下载。\n\n### 3. 安装应用\n在 Android 设备上安装下载好的 APK 文件：\n```bash\nadb install RTranslator-v2.1.0.apk\n```\n或在手机文件管理器中点击安装包进行安装。\n\n## 基本使用\n\n### 首次启动\n打开应用，首次运行会自动下载翻译和语音识别模型（约 1.2GB）。下载完成后即可开始使用。\n\n### 模式一：对话模式 (Conversation Mode)\n适用于两人或多人的长时间深度交流，支持双向实时互译。\n1. **连接设备**：确保双方手机均安装并打开 RTranslator。\n2. **建立连接**：发起连接请求，对方接受后即可配对（支持一对多连接）。\n3. **佩戴耳机**（推荐）：连接蓝牙耳机以获得最佳体验。\n4. **开始交谈**：\n   - 您说话时，音频被捕获并转为文本发送给对方。\n   - 对方手机接收文本，翻译为目标语言，并通过扬声器或耳机播放语音。\n   - 过程完全双向同步。\n\n### 模式二：对讲机模式 (WalkieTalkie Mode)\n适用于街头问路、商店购物等简短交互，仅需一台手机。\n1. **选择语言**：在界面中选择两种需要互译的语言。\n2. **轮流发言**：\n   - 应用同时监听两种语言。\n   - 检测到说话人语言后，自动翻译并播放目标语言语音。\n   - 语音播放完毕后，自动恢复监听状态。\n   - *注意：此模式不支持蓝牙耳机，需轮流说话。*\n\n### 模式三：文本翻译模式 (Text Translation Mode)\n经典的文本输入翻译功能。\n1. 输入或粘贴需要翻译的文字。\n2. 点击“朗读”按钮听取发音，或点击“复制”按钮复制译文。\n\n### 配置提示\n- **更改语音引擎**：进入设置 -> Output -> Text to Speech，选择系统已安装的其他 TTS 引擎（修改后需重启应用）。\n- **低配机型**：若手机性能不足（\u003C6GB RAM），可考虑使用旧版 v1.0（需配置 Google API，非完全免费离线）。\n- **后台运行**：应用支持后台运行，但部分手机可能会限制后台功耗，建议在重要对话时保持屏幕常亮。","一位中国工程师在巴西工厂进行设备调试时，需要与当地葡萄牙语技术人员进行高频、实时的现场沟通。\n\n### 没有 RTranslator 时\n- 沟通严重依赖不稳定的移动网络使用在线翻译软件，在信号弱的车间经常中断或延迟。\n- 必须手持手机操作，无法解放双手去检查电路或操作仪器，导致工作效率低下。\n- 担心敏感的設備参数和技术细节上传至云端服务器，存在数据泄露的合规风险。\n- 轮流对着手机说话的模式打断了技术讨论的连贯性，难以进行深度的多轮对话。\n- 需要额外购买昂贵的专业同声传译硬件或雇佣翻译人员，增加了项目成本。\n\n### 使用 RTranslator 后\n- 利用 Meta NLLB 和 Whisper 模型在手机本地离线运行，即使在无网络的工厂深处也能流畅翻译。\n- 连接蓝牙耳机并将手机放入口袋，工程师可全程解放双手，像讲母语一样自然交流。\n- 所有语音识别与翻译过程均在本地完成，无需联网上传数据，彻底保障了技术隐私安全。\n- 开启“对话模式”实现双向实时互译，支持多人接入，让技术研讨如同单语言环境般顺畅。\n- 完全免费且开源，无需支付订阅费或购买专用设备，显著降低了跨国协作的门槛。\n\nRTranslator 通过本地化实时翻译技术，将普通安卓手机变成了保护隐私、零成本且解放双手的随身同传专家。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fniedev_RTranslator_c281b3ac.png","niedev",null,"https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fniedev_20d99698.png","Software engineer with a deep love for IT in all its facets","Europe, Italy","contact.niedev@gmail.com","niedev1","https:\u002F\u002Fgithub.com\u002Fniedev",[81,85,89,93,96,100,104,108,112],{"name":82,"color":83,"percentage":84},"C++","#f34b7d",84.9,{"name":86,"color":87,"percentage":88},"Java","#b07219",12.6,{"name":90,"color":91,"percentage":92},"Python","#3572A5",0.9,{"name":94,"color":73,"percentage":95},"SWIG",0.7,{"name":97,"color":98,"percentage":99},"Jupyter Notebook","#DA5B0B",0.5,{"name":101,"color":102,"percentage":103},"CMake","#DA3434",0.2,{"name":105,"color":106,"percentage":107},"Perl","#0298c3",0.1,{"name":109,"color":110,"percentage":111},"Shell","#89e051",0,{"name":113,"color":114,"percentage":111},"C","#555555",9780,880,"2026-04-14T07:28:39","Apache-2.0","Android","未说明 (应用直接在手机 CPU\u002FNPU 上运行，无需独立显卡或 CUDA)","最低 6GB",{"notes":123,"python":124,"dependencies":125},"这是一个专为 Android 设计的离线实时翻译应用。首次启动需下载约 1.2GB 的 AI 模型文件（若 GitHub 访问慢可手动导入）。语音合成 (TTS) 依赖手机系统自带的 TTS 引擎（推荐 Google TTS）。部分功能（如 WalkieTalkie 模式的语言识别）使用了闭源的 ML Kit 库。建议在后台运行时保持屏幕开启，以防部分手机限制后台性能导致崩溃。","不适用 (原生 Android 应用，非 Python 脚本)",[126,127,128,129,130],"OnnxRuntime","NLLB-Distilled-600M (AI 模型)","Whisper-Small-244M (AI 模型)","SentencePiece","ML Kit (语言识别)",[14,132,35],"音频",[134,135,136,137,138,139,140,141,142,143,144,145,146,147],"translator","bluetooth-le","realtime-translator","android-app","onnx","onnxruntime","sentencepiece","transformers","translation","nllb","whisper","mobile-app","android","offline","2026-03-27T02:49:30.150509","2026-04-15T04:18:16.992484",[],[152,157,162,167,172,177,182,187,192,197,202,207,212,217,222,227,232,237],{"id":153,"version":154,"summary_zh":155,"released_at":156},255808,"2.1.5","新功能：\n- 在对讲机模式和对话模式中新增了一个设置，可同时显示转写和翻译内容（PR #128，由 @JedLee6 提交）\n- 修复了在 Vivo 手机上音频录制无法正常工作的问题（问题 #155，感谢 @NikolaCavendish 在调试方面的帮助）\n。","2026-02-22T11:37:26",{"id":158,"version":159,"summary_zh":160,"released_at":161},255809,"2.1.4","新功能：\n\n- 新增对高棉语的支持，将其标记为低质量语言（感谢 @KevinChhin 指出此问题）。\n- 在设置中新增束搜索选项，以提升翻译质量（仅适用于文本翻译模式）。\n- 在文本翻译模式中新增取消输入和输出文本的按钮。","2025-05-17T12:57:01",{"id":163,"version":164,"summary_zh":165,"released_at":166},255810,"2.1.3","在低质量语言列表中新增了对波斯语的支持。\n（感谢 @Fouladi-K 在 issue #109 中指出这一点）","2025-03-23T11:24:19",{"id":168,"version":169,"summary_zh":170,"released_at":171},255811,"2.1.2","修复了一个 bug（问题 #81 和 #83），该 bug 导致在处理某些文本时，应用会陷入翻译循环。  \n目前这种情况应该会少一些；即使发生，翻译也会更早停止。\n（感谢 @codeAndxv 指出此问题并提供帮助）","2024-11-01T13:57:36",{"id":173,"version":174,"summary_zh":175,"released_at":176},255812,"2.1.1","已将爱尔兰语添加到仅支持文本的低质量语言列表中（感谢 @Alexanderkocha 指出这一点）","2024-09-27T11:27:49",{"id":178,"version":179,"summary_zh":180,"released_at":181},255813,"2.1.0","新功能：\n\n- 全新 GUI！由 [Chiara Chindamo](https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fchiara-chindamo-946053234\u002F) 设计。\n- 在文本翻译模式中新增了“朗读”和“复制”按钮。\n- 在对讲机模式中增加了手动控制麦克风的选项。\n- 新增了使用低质量语言的选项。\n- 将文本翻译的语言与对讲机和对话模式的语言分开。\n- 增加了乌克兰语本地化（感谢 @OriginalSimon）。\n- 修正了中文本地化（感谢 @Agiens02）。\n- 在应用中集成了 [GalleryImageSelector](https:\u002F\u002Fgithub.com\u002Fniedev\u002FGalleryImageSelector) 代码（感谢 @Agiens02）。\n- 修复了若干 bug。\n","2024-09-04T19:36:26",{"id":183,"version":184,"summary_zh":185,"released_at":186},255814,"2.0.4","该应用现已支持繁体中文（感谢 @abc0922001）和简体中文（感谢 @starlightjy）。\n\n应用图标现已兼容 Material You 主题（感谢 @GitGitro）。\n\n在对讲机模式和对话模式下，静音麦克风不再会取消结果，而只会停止监听（因此在嘈杂环境中可用于强制停止监听）。","2024-07-04T20:37:32",{"id":188,"version":189,"summary_zh":190,"released_at":191},255815,"2.0.3","**对 AI 模型首次下载的改进：**\n\n- **在首次下载中新增了文件完整性校验**。现在，如果下载的文件损坏，系统会提示您，并允许您仅重新下载该文件（此前只有在下载完成后才会检测到损坏，且必须重置应用并从头开始）。\n\n- **新增了在应用启动时修复可能已损坏模型文件的选项**。现在，如果出现错误，不再仅仅建议您重新安装应用，您可以点击“修复”按钮，仅重新下载损坏的文件。\n\n- **新增了侧载功能**。此前因网络状况不佳而无法从 GitHub 下载的用户，现在可以在任何地方完成首次下载，然后将文件推送到应用中。更多信息请参阅[专用指南](https:\u002F\u002Fgithub.com\u002Fniedev\u002FRTranslator\u002Fblob\u002Fv2.00\u002FSideloading.md)。\n\n- **在首次下载过程中新增了存储空间不足的提示**。","2024-07-02T11:36:36",{"id":193,"version":194,"summary_zh":195,"released_at":196},255816,"2.0.2","新增了使用任意TTS引擎的功能（感谢@JingziC）。\n\n现在，即使当前TTS引擎不支持某些语言，这些语言仍然可以正常使用，只是不会启用TTS功能（感谢@JingziC）。\n\n修复了一个导致部分手机上TTS无法正常工作的Bug（感谢@starlightjy）。","2024-06-28T22:14:08",{"id":198,"version":199,"summary_zh":200,"released_at":201},255817,"2.0.1","改进了对缺失TTS的处理：现在如果你没有支持的TTS引擎，仅TTS功能无法使用，应用程序本身仍可正常使用。\n\n修复了一些Bug。","2024-06-20T12:16:30",{"id":203,"version":204,"summary_zh":205,"released_at":206},255818,"2.0.0","The Google API's have been replaced by [Meta's NLLB](https:\u002F\u002Fai.meta.com\u002Fresearch\u002Fno-language-left-behind\u002F) for translation and [OpenAi's Whisper](https:\u002F\u002Fopenai.com\u002Findex\u002Fwhisper\u002F) for speech recognition. These AI models run directly on your phone, so now the app is totally free and with no configuration required!\r\n\r\nA classic text translation mode has been added.\r\n\r\nBluetooth LE device search has been improved.\r\n\r\nFixed some bugs.\r\n\u003Cbr \u002F>\r\n\r\nTo install the app you need to download just \"An_RTranslator_2.0.0.apk\", the other files will be downloaded automatically by the app on the first start.","2024-06-16T14:31:38",{"id":208,"version":209,"summary_zh":210,"released_at":211},255819,"1.1.3","Fixed slow key file search (now you have to put the key in the download folder, not anywhere you want).\r\nUpdated Bluetooth permissions to support android 11.","2021-09-09T13:07:04",{"id":213,"version":214,"summary_zh":215,"released_at":216},255820,"1.1.2","Bug fix","2021-03-09T13:57:58",{"id":218,"version":219,"summary_zh":220,"released_at":221},255821,"1.1.1","Added some advanced settings for voice recognition","2021-03-09T13:43:50",{"id":223,"version":224,"summary_zh":225,"released_at":226},255822,"1.1.0","Added privacy policy\r\nSynchronized versioning with Google Play Store app","2020-11-05T15:28:11",{"id":228,"version":229,"summary_zh":230,"released_at":231},255823,"1.0.2","Bug fixes","2020-10-26T10:16:27",{"id":233,"version":234,"summary_zh":235,"released_at":236},255824,"RTranslator_1.0.1","bug fixes","2020-08-17T11:46:33",{"id":238,"version":64,"summary_zh":239,"released_at":240},255825,"first release","2020-04-10T09:50:11"]