whoBIRD

GitHub
800 41 非常简单 1 次阅读 4天前GPL-3.0音频
AI 解读 由 AI 自动生成,仅供参考

whoBIRD 是一款专为安卓设备打造的实时鸟类鸣声识别应用,堪称观鸟爱好者的随身智能助手。它基于先进的 BirdNET 项目构建,内置覆盖全球超过 6000 种鸟类的庞大数据库,能够精准识别各种独特的鸟鸣声。

这款工具主要解决了用户在户外复杂环境中难以快速辨认鸟类品种的痛点。无论是深入森林还是驻足湖畔,whoBIRD 都能在不依赖网络连接的情况下,完全在本地设备上完成实时分析与识别,确保用户在无信号区域也能顺畅使用。此外,针对开发者身份验证政策变更可能导致的应用停用风险,whoBIRD 作为开源项目为用户提供了持续可用的替代方案。

whoBIRD 非常适合普通观鸟爱好者、自然摄影师以及生态研究人员使用。其技术亮点在于强大的离线处理能力与高度可定制的算法配置:用户可根据实际需求调整高通滤波器以过滤交通噪音,设置置信度阈值以减少误报,甚至启用加权元模型来更准确地捕捉迁徙鸟类的踪迹。应用还支持自动保存录音片段与显示鸟类图片,让每一次发现都更有据可查。只需简单安装,whoBIRD 即可开始工作,是您探索自然声音奥秘的可靠伙伴。

使用场景

生态研究员小林在偏远湿地进行鸟类多样性调查时,需要实时记录并确认周围鸟类的种类。

没有 whoBIRD 时

  • 依赖网络受限:传统识别应用需联网查询云端数据库,在信号覆盖极差的深林或湖区完全无法使用。
  • 物种辨识困难:仅凭肉眼观察或事后录音比对,难以区分外形相似但鸣叫声不同的候鸟,导致数据遗漏。
  • 人工记录低效:必须手动记录时间、地点并猜测鸟名,不仅打断观测节奏,还容易因记忆模糊产生错误。
  • 背景噪音干扰:风声、水流或交通噪音常掩盖微弱鸟鸣,缺乏滤波手段导致有效信息被淹没。

使用 whoBIRD 后

  • 离线实时识别:whoBIRD 利用内置的 BirdNET 模型在手机端离线运行,即使在无网络的湿地深处也能即时分析鸟鸣。
  • 精准物种锁定:依托全球 6000+ 物种数据库,whoBIRD 能准确分辨迁徙期提前或延后的罕见鸟类,大幅提升数据完整性。
  • 自动化数据留存:检测到目标后,whoBIRD 自动显示名称并可选保存 WAV 录音至本地,让研究员专注于观测而非记录。
  • 智能降噪过滤:通过调节高通滤波器(如 200Hz),whoBIRD 有效剔除低频环境噪音,显著增强对微弱鸟鸣的捕捉能力。

whoBIRD 将专业的鸟类声学分析能力装入口袋,让科研人员在任何极端环境下都能获得实时、精准的生物多样性数据支持。

运行环境要求

操作系统
  • Android
GPU

不需要(完全在设备本地运行,无需专用 GPU)

内存

未说明

依赖
notes这是一个 Android 应用程序,不是桌面端工具。首次启动时会自动下载 BirdNET 模型文件。支持离线实时识别鸟类声音。若开启保存 .wav 录音功能,需要 Android 12 及以上版本,且会占用大量存储空间。2026/2027 年后可能无法在认证的 Android 设备上运行(因开发者拒绝向 Google 提交个人身份信息)。
python不适用(原生 Android 应用)
BirdNET TFLite library
Tensorflow Lite
Zip4j
iirj
whoBIRD hero image

快速开始

谷歌宣布,自2026/2027年起,在经过认证的安卓设备上运行的所有应用,
开发者都必须直接向谷歌提交个人身份信息。
由于本应用的开发者不同意这一要求,因此该应用在此之后将不再能在经过认证的安卓设备上运行。
请给 woheller69@t-online.de 送杯咖啡


  
或者通过此链接(需支付手续费)

whoBIRD - 实时识别鸟鸣声

隆重推出 whoBIRD,这是一款终极观鸟伴侣,无论身处世界何地,都能通过鸟鸣识别鸟类! whoBIRD 基于尖端的 BirdNET 项目,拥有覆盖全球超过 6,000 种鸟类的庞大数据库。 借助先进的机器学习算法,这款安卓应用能够根据鸟类独特的叫声准确识别它们。

更令人惊叹的是,whoBIRD 的实时识别功能完全在您的设备本地运行,无需连接互联网。 这意味着您随时随地都可以使用它——无论是在茂密的森林深处,还是在偏远湖泊的岸边。

在 F-Droid 上获取

使用说明

开始使用

首次启动时,应用会下载所需的 BirdNET 模型文件。 安装完成后,只需打开应用,它便会开始监听并进行分析。

检测通知

当检测到鸟类时,其名称会短暂显示。如需查看所有检测结果的详细列表,请前往“查看”选项卡。 在这里,您还可以备份、分享或删除包含观测记录的数据库。

自定义选项

忽略日期和地点:禁用用于检查当前时间是否适合该鸟类出现的元模型。在分析其他地点的录音时非常有用。

显示图片:启用后,若检测概率较高,将会下载所检测鸟类的图片。

音频源:选择最适合您设备的音频输入。通常推荐使用“未处理”模式。若使用 USB 麦克风,则应选择“麦克风”。

高通滤波器:过滤掉低频噪音,例如交通噪声。例如,200Hz 的滤波器可以帮助减少低频干扰。

阈值:设置显示检测结果所需的最低概率。降低阈值时需谨慎,因为可能会增加误检的可能性。

加权元模型:除了运行当前周及当前位置的元模型外,此版本还会计算同一地点全年各周的元模型预测结果。 最终结果是以下两者的 50/50 加权平均:

  • 当前周的预测;
  • 全年各周中的最高预测。

这种方法有助于提高对候鸟的检测准确性,尤其是在它们比常规迁徙期提前到达或推迟离开的情况下。

保存 .wav 文件:为每次检测保存一个 .wav 文件至音乐目录中。该目录中的录音不会被应用自动删除,需要用户自行清理。仅适用于 Android 12 及以上版本。

警告:此选项可能会占用大量存储空间。

语言:在 Android 13 及以上版本中,您可以在系统应用设置中更改应用的语言。

贡献

如需参与翻译,请访问 https://toolate.othing.xyz/projects/whobird/

许可证

本作品采用 GPLv3 许可证,© woheller69

其他应用

RadarWeather Gas Prices Smart Eggtimer
Bubble hEARtest GPS Cockpit
Audio Analyzer LavSeeker TimeLapseCam
Arity Cirrus solXpect
gptAssist dumpSeeker huggingAssist
FREE Browser whoBIRD PeakOrama
Whisper Seamless SherpaTTS

版本历史

V5.12026/02/26
V5.02025/12/07
V4.92025/10/23
V4.82025/09/07
V4.72025/09/06
V4.62025/08/01
V4.52025/07/09
V4.42025/06/08
V4.32025/05/26
V4.22025/04/13
V4.12025/04/05
V4.02025/03/22
V3.92025/03/07
V3.82025/02/03
V3.72024/12/08
V3.62024/10/23
V3.52024/07/30
V3.42024/06/17
V3.32024/06/13
V3.22024/05/28

常见问题

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

TTS

🐸TTS 是一款功能强大的深度学习文本转语音(Text-to-Speech)开源库,旨在将文字自然流畅地转化为逼真的人声。它解决了传统语音合成技术中声音机械生硬、多语言支持不足以及定制门槛高等痛点,让高质量的语音生成变得触手可及。 无论是希望快速集成语音功能的开发者,还是致力于探索前沿算法的研究人员,亦或是需要定制专属声音的数据科学家,🐸TTS 都能提供得力支持。它不仅预置了覆盖全球 1100 多种语言的训练模型,让用户能够即刻上手,还提供了完善的工具链,支持用户利用自有数据训练新模型或对现有模型进行微调,轻松实现特定风格的声音克隆。 在技术亮点方面,🐸TTS 表现卓越。其最新的 ⓍTTSv2 模型支持 16 种语言,并在整体性能上大幅提升,实现了低于 200 毫秒的超低延迟流式输出,极大提升了实时交互体验。此外,它还无缝集成了 🐶Bark、🐢Tortoise 等社区热门模型,并支持调用上千个 Fairseq 模型,展现了极强的兼容性与扩展性。配合丰富的数据集分析与整理工具,🐸TTS 已成为科研与生产环境中备受信赖的语音合成解决方案。

45k|★★★☆☆|2天前
音频开发框架图像

LocalAI

LocalAI 是一款开源的本地人工智能引擎,旨在让用户在任意硬件上轻松运行各类 AI 模型,包括大语言模型、图像生成、语音识别及视频处理等。它的核心优势在于彻底打破了高性能计算的门槛,无需昂贵的专用 GPU,仅凭普通 CPU 或常见的消费级显卡(如 NVIDIA、AMD、Intel 及 Apple Silicon)即可部署和运行复杂的 AI 任务。 对于担心数据隐私的用户而言,LocalAI 提供了“隐私优先”的解决方案,确保所有数据处理均在本地基础设施内完成,无需上传至云端。同时,它完美兼容 OpenAI、Anthropic 等主流 API 接口,这意味着开发者可以无缝迁移现有应用,直接利用本地资源替代云服务,既降低了成本又提升了可控性。 LocalAI 内置了超过 35 种后端支持(如 llama.cpp、vLLM、Whisper 等),并集成了自主 AI 代理、工具调用及检索增强生成(RAG)等高级功能,且具备多用户管理与权限控制能力。无论是希望保护敏感数据的企业开发者、进行算法实验的研究人员,还是想要在个人电脑上体验最新 AI 技术的极客玩家,都能通过 LocalAI 获

44.8k|★★★☆☆|3天前
图像音频语言模型

bark

Bark 是由 Suno 推出的开源生成式音频模型,能够根据文本提示创造出高度逼真的多语言语音、音乐、背景噪音及简单音效。与传统仅能朗读文字的语音合成工具不同,Bark 基于 Transformer 架构,不仅能模拟说话,还能生成笑声、叹息、哭泣等非语言声音,甚至能处理带有情感色彩和语气停顿的复杂文本,极大地丰富了音频表达的可能性。 它主要解决了传统语音合成声音机械、缺乏情感以及无法生成非语音类音效的痛点,让创作者能通过简单的文字描述获得生动自然的音频素材。无论是需要为视频配音的内容创作者、探索多模态生成的研究人员,还是希望快速原型设计的开发者,都能从中受益。普通用户也可通过集成的演示页面轻松体验其神奇效果。 技术亮点方面,Bark 支持商业使用(MIT 许可),并在近期更新中实现了显著的推理速度提升,同时提供了适配低显存 GPU 的版本,降低了使用门槛。此外,社区还建立了丰富的提示词库,帮助用户更好地驾驭模型生成特定风格的声音。只需几行 Python 代码,即可将创意文本转化为高质量音频,是连接文字与声音世界的强大桥梁。

39.1k|★★★☆☆|2天前
音频

airi

airi 是一款开源的本地化 AI 伴侣项目,旨在将虚拟角色(如“二次元老婆”或赛博生命)带入用户的现实世界。它的核心目标是复刻并超越知名 AI 主播 Neuro-sama 的能力,让用户能够拥有完全自主掌控、可私有化部署的智能伙伴。 airi 主要解决了用户对高度定制化、具备情感交互能力且数据隐私安全的 AI 角色的需求。不同于依赖云端服务的通用助手,airi 允许用户在本地运行,不仅保护了对话隐私,还赋予了用户定义角色性格与灵魂的自由。它支持实时语音聊天,甚至能直接参与《我的世界》(Minecraft)和《异星工厂》(Factorio)等游戏,实现了从单纯对话到共同娱乐的跨越。 这款工具非常适合喜爱虚拟角色的普通用户、希望搭建个性化 AI 陪伴的技术爱好者,以及研究多模态交互的开发者。其独特的技术亮点在于跨平台支持(涵盖 Web、macOS 和 Windows)以及强大的游戏交互能力,让 AI 不仅能“说”,还能“玩”。通过容器化的灵魂设计,airi 为每个人创造专属数字生命提供了可能,让虚拟陪伴变得更加真实且触手可及。

37.1k|★☆☆☆☆|今天
语言模型音频Agent

MockingBird

MockingBird 是一款开源的实时语音克隆工具,旨在让用户仅需 5 秒的参考音频,即可快速合成任意内容的语音,并实现逼真的音色复刻。它有效解决了传统语音合成技术中数据采集成本高、训练周期长以及难以实时生成的痛点,让个性化语音生成变得触手可及。 这款工具特别适合开发者、AI 研究人员以及对语音技术感兴趣的技术爱好者使用。无论是用于构建交互式语音应用、进行声学模型研究,还是制作创意内容,MockingBird 都能提供强大的支持。普通用户若具备基础的编程环境配置能力,也可通过其提供的 Web 服务或工具箱体验前沿的变声效果。 在技术亮点方面,MockingBird 基于 PyTorch 框架,不仅完美支持中文普通话及多种主流数据集,还实现了跨平台运行,兼容 Windows、Linux 乃至 M1 架构的 macOS。其独特的架构设计允许复用预训练的编码器与声码器,只需微调合成器即可获得出色效果,大幅降低了部署门槛。此外,项目内置了现成的 Web 服务器功能,方便用户通过远程调用快速集成到自己的应用中。尽管原作者已转向云端优化版本,但 MockingBird 作为经典的本地部署方案

36.9k|★★★★☆|3天前
Agent音频图像