[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-AlexZhangji--Twitter-Insight-LLM":3,"tool-AlexZhangji--Twitter-Insight-LLM":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",151314,2,"2026-04-11T23:32:58",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":77,"owner_email":78,"owner_twitter":76,"owner_website":79,"owner_url":80,"languages":81,"stars":90,"forks":91,"last_commit_at":92,"license":76,"difficulty_score":32,"env_os":93,"env_gpu":94,"env_ram":93,"env_deps":95,"category_tags":103,"github_topics":76,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":104,"updated_at":105,"faqs":106,"releases":107},6795,"AlexZhangji\u002FTwitter-Insight-LLM","Twitter-Insight-LLM","Twitter data scraping, embedding based image search and more.","Twitter-Insight-LLM 是一款专为推特数据深度挖掘与分析打造的开源工具。它不仅能通过 Selenium 自动抓取用户点赞的推文并导出为 JSON 或 Excel 格式，还能对数据进行可视化分析，例如展示不同媒体类型的点赞趋势或生成每日点赞热力图。\n\n对于希望量化分析社交媒体行为、研究内容偏好或构建个人数据集的用户而言，这款工具有效解决了手动收集数据效率低、难以进行结构化分析的痛点。它特别适合开发者、数据研究人员以及需要追踪特定账号互动情况的普通进阶用户使用。\n\n除了基础的数据采集，Twitter-Insight-LLM 还具备独特的技术亮点：支持基于大语言模型（LLM）的图片自动描述生成，并引入了无需 GPU 支持的嵌入式图像搜索功能。用户可以直接用自然语言（如“黑猫”或抽象的“悲伤”）在已下载的图片库中进行语义检索，即使图片没有标签也能精准定位。整个项目架构清晰，既可作为独立的数据分析助手，也是探索大型语言模型应用的优秀入门实践。","# Twitter-Insight💡: Data Scraping, Analysis, Image caption and More\n\n[中文Readme](README_zh.md)\n\nThis project enables you to fetch liked tweets from Twitter (using Selenium), save it to JSON and Excel files, and perform initial data analysis and image captions.\n\nThis is part of the initial steps for a larger personal project involving Large Language Models (LLMs).\nStay tuned for more updates!\n\n### Example of Exported Excel sheets & Visualizations:\n\n![Sample Images](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_2f18fd396436.png)\n\n\n\n## (new!) Experimental Embedding Based Image Search: Search unlabeled images with nartual language. \nA new free image embedding tool with a supporting frontend that does not require GPU support has been added. (Supports multiple languages, although the results are better in English.)\n\nFor example, here are the results for a searchon \"black cat\" (in Chinese) but you can also searchfor \"a group of people in a photo,\" \"workflow graphs,\" or more abstract concepts like \"sadness.\"\n\n![img](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_90e5f4c9a158.png)\n\nHow to run:\n\n-First, make sure that the data has already been downloaded; image downloading requires previous Twitter data (including image URLs).\n\n- Run the newly added `download_images` in the notebook.\n  -In the console, run `streamlit run image_search_webapp.py` and follow the prompts to automatically embed images. No need to embed repeatedly.\n\n\n## Demo Video\n\n[Demo](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=UA35W-aWQZk)\n\n## Prerequisites\n\nBefore running the code, ensure you have the following:\n\n- Required Python libraries (listed in `requirements.txt`)\n- Get your twitter auth token (Not API key)\n  - Quick text instruction:\n  - - Go to your already logged-in twitter\n    - F12 (open dev tools) -> Application -> Cookies -> Twitter.com -> auth_key\n  - or follow the video demo in FAQ section.\n- OpenAI API key (optional, only needed if you want to try the image captions feature)\n\n## Setup\n\n1. Clone the repository or download the project files.\n2. Install the required Python libraries by running the following command:\n\n```\npip install -r requirements.txt\n```\n\n3. Open the `config.py` file and replace the placeholders with your actual API keys:\n\n- Set `TWITTER_AUTH_TOKEN` to your Twitter API authentication token.\n- Set `OPENAI_API_KEY` to your OpenAI API key.\n\n## Data Ingestion\n\nTo fetch data from Twitter and save it to JSON and Excel files, follow these steps:\n\n1. Open the `twitter_data_ingestion.py` file.\n2. Modify the `fetch_tweets` function call at the bottom of the script with your desired parameters:\n\n- Set the URL of the Twitter page you want to fetch data from (e.g., `https:\u002F\u002Ftwitter.com\u002Filyasut\u002Flikes`).\n- Specify the start and end dates for the data range (in YYYY-MM-DD format).\n\n3. Run the script by executing the following command (recommend run this in IDE directly):\n\n   ```\n   python twitter_data_ingestion.py\n   ```\n4. The script will fetch the data from Twitter, save it to a JSON file, and then export it to an Excel file.\n\n## Data Analysis\n\nTo perform initial data analysis on the fetched data, follow these steps:\n\n1. Open the `twitter_data_initial_exploration.ipynb` notebook in Jupyter Notebook or JupyterLab.\n2. Run the notebook cells sequentially to load the data from the JSON file and perform various data analysis tasks.\n\nSome sample results:\n\n- Visualizing likes by media type over time\n  ![Likes Analysis by Media Type](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_34121fa42305.png)\n- Creating a calendar heatmap of liked tweets per day\n  ![Number of Liked Tweets per Day](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_b5c91bc7d592.png)\n\n3. The notebook also demonstrates how to use the OpenAI API to generate image captions for tweet images (with tweet metadata).\n   ![Sample Image Caption](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_d65367f199c0.jpg)\n\n## Sample Output\n\nThe project includes sample output files for reference:\n\n- `sample_output_json.json`: A sample JSON file containing the fetched Twitter data.\n- `sample_exported_excel.xlsx`: A sample Excel file exported from the JSON data.\n\nFeel free to explore and modify the code to suit your specific data analysis requirements.\n\n## FAQs:\n\n- Will I get banned? Could this affect my account?\n\n  - Selenium is one of the safest scraping methods out there, but it's still best to be cautious when using it for personal projects.\n  - I've been using it for quite a while without any issues.\n  - (Though, if you've got a spare \u002F alt account, I'd recommend using that one's auth token instead)\n- How do I find the auth token?\n\n  - Check out this for a step-by-step guide!\n    - [video demo](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=MhKMNsbjug4)\n\n## Contributing\n\nContributions to this project are welcome. If you find any issues or have suggestions for improvements, please open an issue or submit a pull request.\n\n## Acknowledgements\n\n- Initial structure and parts of the Selenium code inspired by [Twitter-Scrapper](https:\u002F\u002Fgithub.com\u002FMostafa-Ehab\u002FTwitter-Scrapper).\n- The image captioning feature is powered by the OpenAI API. You should be able to achieve similar results using Gemini 1.0 or Claude Haiku.\n\nFor any questions or issues, please open an issue in the repository.\n","# Twitter洞察💡：数据抓取、分析、图片说明等\n\n[中文Readme](README_zh.md)\n\n该项目允许您使用Selenium从Twitter获取点赞的推文，将其保存为JSON和Excel文件，并进行初步的数据分析和图片说明生成。\n\n这是更大规模个人项目（涉及大型语言模型LLMs）的初始步骤之一。\n敬请期待更多更新！\n\n### 导出的Excel表格与可视化示例：\n\n![示例图片](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_2f18fd396436.png)\n\n\n\n## （新！）基于嵌入的实验性图像搜索：用自然语言搜索未标注的图片。\n新增了一个免费的图像嵌入工具及配套前端，无需GPU支持。（支持多种语言，但英文效果更佳。）\n\n例如，以下是“黑猫”（中文）的搜索结果，您也可以搜索“照片中的一群人”、“工作流图”，或更抽象的概念如“悲伤”。\n\n![img](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_90e5f4c9a158.png)\n\n如何运行：\n\n- 首先，请确保数据已下载；图片下载需要先有Twitter数据（包括图片URL）。\n- 在笔记本中运行新添加的`download_images`脚本。\n  - 在终端中运行`streamlit run image_search_webapp.py`，并按照提示操作以自动嵌入图片。无需重复嵌入。\n\n\n## 演示视频\n\n[演示](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=UA35W-aWQZk)\n\n## 前置条件\n\n在运行代码之前，请确保您已具备以下内容：\n\n- 必要的Python库（列于`requirements.txt`中）\n- 获取您的Twitter认证令牌（非API密钥）\n  - 简单说明：\n  - - 登录您的Twitter账号\n    - 按F12打开开发者工具 -> Application -> Cookies -> Twitter.com -> auth_key\n  - 或参考常见问题解答部分的视频演示。\n- OpenAI API密钥（可选，仅在您想尝试图片说明功能时需要）\n\n## 设置\n\n1. 克隆仓库或下载项目文件。\n2. 安装所需的Python库，运行以下命令：\n\n```\npip install -r requirements.txt\n```\n\n3. 打开`config.py`文件，将占位符替换为您实际的API密钥：\n\n- 将`TWITTER_AUTH_TOKEN`设置为您的Twitter API认证令牌。\n- 将`OPENAI_API_KEY`设置为您的OpenAI API密钥。\n\n## 数据抓取\n\n要从Twitter抓取数据并将其保存为JSON和Excel文件，请按照以下步骤操作：\n\n1. 打开`twitter_data_ingestion.py`文件。\n2. 修改脚本底部的`fetch_tweets`函数调用，根据您的需求设置参数：\n\n- 设置您想要抓取数据的Twitter页面URL（例如：`https:\u002F\u002Ftwitter.com\u002Filyasut\u002Flikes`）。\n- 指定数据范围的开始和结束日期（格式为YYYY-MM-DD）。\n\n3. 运行脚本，执行以下命令（建议直接在IDE中运行）：\n\n   ```\n   python twitter_data_ingestion.py\n   ```\n4. 脚本将从Twitter抓取数据，保存为JSON文件，然后导出为Excel文件。\n\n## 数据分析\n\n要对抓取的数据进行初步分析，请按照以下步骤操作：\n\n1. 在Jupyter Notebook或JupyterLab中打开`twitter_data_initial_exploration.ipynb`笔记本。\n2. 依次运行笔记本中的单元格，以加载JSON文件中的数据并执行各种数据分析任务。\n\n一些示例结果：\n\n- 按媒体类型随时间变化的点赞数可视化\n  ![按媒体类型分析点赞数](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_34121fa42305.png)\n- 创建每日点赞推文的日历热力图\n  ![每日点赞推文数量](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_b5c91bc7d592.png)\n\n3. 笔记本还展示了如何使用OpenAI API为推文图片生成说明文字（结合推文元数据）。\n   ![示例图片说明](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_readme_d65367f199c0.jpg)\n\n## 示例输出\n\n项目包含示例输出文件供参考：\n\n- `sample_output_json.json`：包含抓取的Twitter数据的示例JSON文件。\n- `sample_exported_excel.xlsx`：从JSON数据导出的示例Excel文件。\n\n您可以自由探索和修改代码，以满足您特定的数据分析需求。\n\n## 常见问题：\n\n- 我会被封号吗？这会影响我的账号吗？\n\n  - Selenium是目前最安全的爬虫方法之一，但在个人项目中使用时仍需谨慎。\n  - 我已经使用了很长时间，从未遇到过问题。\n  - （不过，如果您有一个备用或副账号，我建议使用该账号的认证令牌）\n- 如何找到认证令牌？\n\n  - 请查看此分步指南！\n    - [视频演示](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=MhKMNsbjug4)\n\n## 贡献\n\n欢迎为该项目做出贡献。如果您发现任何问题或有改进建议，请提交问题或拉取请求。\n\n## 致谢\n\n- 初始结构和部分Selenium代码灵感来自[Twitter-Scrapper](https:\u002F\u002Fgithub.com\u002FMostafa-Ehab\u002FTwitter-Scrapper)。\n- 图片说明功能由OpenAI API提供支持。您也可以使用Gemini 1.0或Claude Haiku实现类似效果。\n\n如有任何疑问或问题，请在仓库中提交问题。","# Twitter-Insight-LLM 快速上手指南\n\nTwitter-Insight 是一个用于抓取 Twitter（现 X）点赞推文、保存为 JSON\u002FExcel 格式，并进行初步数据分析及图片标题生成的开源工具。本项目支持基于嵌入的图像搜索功能，无需 GPU 即可运行。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Windows \u002F macOS \u002F Linux\n*   **Python 版本**：建议 Python 3.8 及以上\n*   **浏览器**：已安装 Chrome 或 Firefox（用于 Selenium 驱动）\n*   **必要凭证**：\n    *   **Twitter Auth Token**：非 API Key。获取方式：登录 Twitter -> F12 打开开发者工具 -> Application -> Cookies -> twitter.com -> 复制 `auth_key` 的值。\n    *   **OpenAI API Key**（可选）：仅在使用图片自动描述功能时需要。\n\n## 安装步骤\n\n1.  **克隆项目代码**\n    ```bash\n    git clone \u003Crepository_url>\n    cd Twitter-Insight-LLM\n    ```\n\n2.  **安装依赖库**\n    建议使用国内镜像源加速安装：\n    ```bash\n    pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n    ```\n\n3.  **配置密钥**\n    打开 `config.py` 文件，将占位符替换为您实际的凭证：\n    *   设置 `TWITTER_AUTH_TOKEN` 为您的 Twitter 认证令牌。\n    *   设置 `OPENAI_API_KEY` 为您的 OpenAI API 密钥（如需使用图片描述功能）。\n\n## 基本使用\n\n### 1. 数据抓取 (Data Ingestion)\n\n此步骤将抓取指定页面的点赞推文并导出为 JSON 和 Excel 文件。\n\n*   打开 `twitter_data_ingestion.py` 文件。\n*   修改脚本底部的 `fetch_tweets` 函数调用参数：\n    *   `url`: 目标 Twitter 页面链接（例如：`https:\u002F\u002Ftwitter.com\u002Filyasut\u002Flikes`）。\n    *   `start_date` \u002F `end_date`: 数据范围（格式：`YYYY-MM-DD`）。\n*   运行脚本：\n    ```bash\n    python twitter_data_ingestion.py\n    ```\n    *脚本执行完成后，将在目录下生成对应的 JSON 和 Excel 数据文件。*\n\n### 2. 数据分析与可视化 (Data Analysis)\n\n使用 Jupyter Notebook 对抓取的数据进行探索和可视化。\n\n*   启动 Jupyter Lab 或 Notebook：\n    ```bash\n    jupyter lab\n    ```\n*   打开 `twitter_data_initial_exploration.ipynb`。\n*   按顺序运行单元格，即可看到：\n    *   按媒体类型统计的点赞趋势图。\n    *   每日点赞推文的日历热力图。\n    *   （可选）调用 OpenAI API 生成的推文图片描述示例。\n\n### 3. 实验性功能：基于自然语言的图片搜索\n\n如果您已下载包含图片 URL 的 Twitter 数据，可尝试无标签图片搜索功能。\n\n*   **第一步：下载图片**\n    在 `twitter_data_initial_exploration.ipynb` 或其他 Notebook 中运行新增的 `download_images` 代码块，将图片下载到本地。\n\n*   **第二步：启动搜索应用**\n    在终端运行以下命令启动 Streamlit 前端：\n    ```bash\n    streamlit run image_search_webapp.py\n    ```\n    系统会自动处理图片嵌入（Embedding），无需重复操作。启动后，您可以在浏览器中使用中文或英文自然语言（如“黑猫”、“悲伤”）搜索图片。","某数字营销分析师需要深入复盘竞品账号过去半年的互动策略，特别是其点赞的高热度视觉素材，以优化自身的內容选题方向。\n\n### 没有 Twitter-Insight-LLM 时\n- **数据采集繁琐**：只能手动逐页翻找竞品点赞列表，或使用不稳定的脚本，难以批量获取带时间戳的结构化数据。\n- **图片检索低效**：面对数百张保存下来的无标签图片，无法通过“悲伤氛围”或“工作流程图”等抽象概念快速筛选目标素材。\n- **洞察缺乏深度**：仅能统计点赞数量，无法自动分析图片内容或生成描述，难以发现竞品在特定媒体类型上的偏好规律。\n- **报表制作耗时**：需人工将分散的数据整理进 Excel 并绘制图表，耗费大量时间在格式调整而非策略分析上。\n\n### 使用 Twitter-Insight-LLM 后\n- **一键自动化采集**：配置 auth token 后，Twitter-Insight-LLM 可自动抓取指定时间段内的点赞推文，直接输出标准的 JSON 和 Excel 文件。\n- **自然语言搜图**：利用其嵌入搜索功能，直接用中文输入“黑猫”或“团队协作”即可在本地毫秒级定位相关未标记图片，无需手动翻阅。\n- **智能内容增强**：集成 OpenAI 自动为推文配图生成详细标题（Caption），并结合可视化图表直观展示不同媒体类型的热度趋势。\n- **分析流程闭环**：内置 Jupyter 笔记本直接生成日历热力图和媒体分析图，让分析师能立即从数据中提取可执行的运营建议。\n\nTwitter-Insight-LLM 将原本需要数天的人工搜集与整理工作，压缩为小时级的自动化智能分析流程，让数据真正驱动内容决策。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAlexZhangji_Twitter-Insight-LLM_90e5f4c9.png","AlexZhangji","Ji","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FAlexZhangji_7b12e2c6.jpg","Still Under construction...\r\n\r\nMachine Learning and LLM Engineer.  \r\nI will do indie games, some day...",null,"Los Angeles","jizhang.work@gmail.com","AlexZhangji.github.io","https:\u002F\u002Fgithub.com\u002FAlexZhangji",[82,86],{"name":83,"color":84,"percentage":85},"Jupyter Notebook","#DA5B0B",85.3,{"name":87,"color":88,"percentage":89},"Python","#3572A5",14.7,679,80,"2026-04-02T07:17:14","未说明","非必需（图像嵌入搜索功能明确说明不需要 GPU 支持）",{"notes":96,"python":93,"dependencies":97},"1. 需要获取 Twitter 的 auth_token（非 API Key），可通过浏览器开发者工具从 Cookie 中提取。\n2. OpenAI API Key 为可选，仅在需要使用图像描述生成功能时必需。\n3. 运行图像搜索前需先执行数据下载脚本获取包含图片 URL 的 Twitter 数据。\n4. 项目主要使用 Selenium 进行数据抓取，相比直接调用 API 更安全，但仍建议使用备用账号以防封号风险。",[98,99,100,101,102],"selenium","streamlit","openai","pandas","jupyter",[35,15,16],"2026-03-27T02:49:30.150509","2026-04-12T13:58:35.666030",[],[]]