
大家好,我是Echa。
最近科技圈内关于Open AI 中ChatGPT火爆全网。首先微软官方推出 New Bing首款Chat GPT 搜索,对所有用户放开,注册即可用,然后 Google 官方接着发布 ChatGPT 的对手产品 Bard,接着GitHub 推出 GitHub Copilot X,然后OpenAI 团队上线了「ChatGPT 插件系统」,再接着又是百度团队发布文心一言,层层科技大厂都亮出自己的王炸,完全不给人喘息的机会。比尔盖茨发言人工智能时代已经来临了。
可以说让小编感受到AI 时代的确来了,互联网时代在逐渐慢慢退出舞台了。
在这短短的几天时间里,GitHub 上每天也都有新项目涌出,让小编我感受到科技领域方面国外的技术水平跟咱们的科技技术,那差了一大截。
今天小编跟大家分享10个惊艳的 ChatGPT 开源项目,有兴趣的小伙伴们可以研究研究,说不定发现新商机,新大陆了。
全文大纲
- semantic-kernel - Copilot 开源解决方案
- shell_gpt -让命令行也能用上 ChatGPT
- feishu-chatgpt -飞书 GPT
- bloop -一款基于 GPT-4 的代码搜索引擎
- gpt4-pdf-chatbot-langchain-ChatPDF 开源解决方案
- vscode-chatgpt-VSCode 智能插件
- openai-translator-基于 ChatGPT API 的划词翻译浏览器插件
- DocsGPT-基于GPT支持的文档搜索和帮助聊天
- chatgpt-on-wechat -基于ChatGPT的微信聊天机器人
- Access-chatGPT-in-Siri- 基于chatGPT接入Siri指南
semantic-kernel
官网:https://aka.ms/semantic-kernel
Github:https://github.com/microsoft/semantic-kernel
自从微软正式发布了Microsoft 365 Copilot之后,Copilot 这个单词在互联网媒体捧热了。 Copilot has caught lightning in a bottle (大概意思是:Copilot 在瓶中捕捉到了闪电)。
这也是最近各界商业资本看到新一轮AI商机,新一轮技术革命来临了。
为了让开发者们也能用上AI 大型语言模型 (LLM) 的能力,微软快速了在Github 上开源了Copilot 解决方案项目,就诞生了 semantic-kernel(SK)。
semantic-kernel(SK)是一个轻量级SDK,能够将人工智能大型语言模型(LLM)与传统编程语言集成。SK可扩展编程模型结合了自然语言语义功能、传统代码原生功能和基于嵌入的内存,利用人工智能释放新的潜力并为应用程序增加价值。
SK支持即时模板、函数链接、矢量化内存和开箱即用的智能规划功能。
semantic-kernel(SK)旨在支持和封装最新人工智能研究中的几种设计模式,使开发人员能够为其应用程序注入复杂的技能,如提示链接、递归推理、摘要、零/少量镜头学习、上下文记忆、长期记忆、嵌入、语义索引、规划,以及访问外部知识存储以及您自己的数据。
通过加入SK社区,您可以更快地构建人工智能优先应用程序,并在前排预览SDK的构建过程。SK已以开源形式发布,以便更多开拓性的开发人员能够加入我们的行列,共同打造这一计算机历史上具有里程碑意义的时刻的未来。
具体如下图:



shell_gpt
Github: https://github.com/TheR1D/shell_gpt
shell_gpt 是基于由OpenAI的ChatGPT(GPT-3.5)提供支持的命令行生产力工具。作为开发人员,我们可以利用ChatGPT功能生成shell命令、代码片段、注释和文档等。忘记备忘单和笔记吧,有了这个工具,你可以在终端中获得准确的答案,你可能会发现自己减少了每天的谷歌搜索,为你节省了宝贵的时间和精力。 该工具直接在命令行中集成了 ChatGPT,通过它,可以帮助你快速编写 shell 命令、代码片段编写、Git 提交信息、文档、注释等内容。
用法主要有以下几种:
- 获取某个任务的执行指令;
- 直接转换时间、距离、重量、温度等单位;
- 在命令行终端搜索 shell 用法;
- 自动生成代码并存储;
- 在命令行跟 ChatGPT 对话,并迭代优化。
简单来说,它就是一个本地命令行机器人。你下达指令,它负责执行,即便你不清楚某个任务该怎么用命令行来实现,也可以直接问它。
pip install shell-gpt
具体如下图:


feishu-chatgpt
Github: https://github.com/Leizhenpeng/feishu-chatgpt
feishu-chatgpt 基于飞书 ×(GPT-3.5 + DALL·E + Whisper)= 飞一般的工作体验 语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出
机器人功能
- 语音交流:私人直接与机器人畅所欲言
- 多话题对话:支持私人和群聊多话题讨论,高效连贯
- 文本成图:支持文本成图和以图搜图
- 角色扮演:支持场景模式,增添讨论乐趣和创意
- 上下文保留:回复对话框即可继续同一话题讨论
- ⏰ 自动结束:超时自动结束对话,支持清除讨论历史
- 富文本卡片:支持富文本卡片回复,信息更丰富多彩
- 交互式反馈:即时获取机器人处理结果
- 场景预设:内置丰富场景预设,方便用户管理场景
- 历史回档:轻松回档历史对话,继续话题讨论
- 管理员模式:内置管理员模式,使用更安全可靠
- 多token负载均衡:优化生产级别的高频调用场景
- ↩️ 支持反向代理:为不同地区的用户提供更快、更稳定的访问体验
- 与飞书文档互动:成为企业员工的超级助手
- 话题内容秒转PPT:让你的汇报从此变得更加简单
- 表格分析:轻松导入飞书表格,提升数据分析效率
项目特点
- 基于 OpenAI-gpt-3.5-turbo 接口
- 通过 lark,将 ChatGPT 接入飞书
- 支持Serverless 云函数、本地环境、Docker、二进制安装包多种渠道部署
- 基于goCache内存键值对缓存
具体如下图:


bloop
Github: https://github.com/BloopAI/bloop
bloop是一个代码搜索引擎,它使用GPT-4来回答有关代码的问题。使用自然语言、正则表达式和过滤查询搜索本地和远程存储库。
功能特点:
- 基于 GPT-4 的会话搜索;
- 快速的正则表达式搜索;
- 同步本地和 GitHub 仓库;
- 支持多种不同查询方式的过滤器;
- 使用符号搜索查找函数、变量或特征
- 拥有 10 多种编程流行语言的精确代码导航。
由于该项目代码完全开源,因此你也可以将其功能集成进企业内部的管理系统,以增强对技术文档、使用手册、教程等内容的检索效率。
具体如下图:


gpt4-pdf-chatbot-langchain
官网:https://www.chatpdf.com/
Github: https://github.com/mayooear/gpt4-pdf-chatbot-langchain
为了解决文档交流和打印的问题,1993 年,Adobe 推出了第一版 PDF。
当时,为了寻找一种能够在各个计算机平台上保持文档格式不变的格式。Adobe 公司开始研发 PDF,这种格式将文本、图像、字体和布局等元素都嵌入到一个文件中,从而保证了文件在不同的操作系统和设备上能够呈现一致的效果。
自发布以来,PDF 便得到了广泛应用,我们日常接触较多的电子合同、个人简历、电子书籍都离不开 PDF 的身影。
发展至今,PDF 已成为了数字化时代的重要组成部分。
它可以提取 PDF 文件中的内容,并将内容交给 ChatGPT 进行分析。待解析完成之后,你便可以跟它进行一对一对话交流,就好像它是一个完全理解内容的人一样。
gpt4 pdf chatbot langchain 使用新的GPT-4 api为大型PDF文档构建聊天GPT聊天机器人.
使用的技术堆栈包括LangChain、Pinecone、Typescript、Openai和Next.js。LangChain是一个框架,可以更容易地构建可扩展的AI/LLM应用程序和聊天机器人。Pinecone是一个向量库,用于将嵌入和PDF存储在文本中,以便以后检索类似的文档。
具体如下图:




vscode-chatgpt
Github: https://github.com/gencay/vscode-chatgpt
VS代码中最受欢迎的*ChatGPT扩展开源
- 该项目是作为一个业余项目建立的-不隶属于任何组织
- 该功能完全依赖于OpenAI服务,没有任何附属关系
- *在发布后3个月内,约有500000名开发者*载下**,评分超过100五星
- 在市场上试用此扩展:ChatGPT-Genie AI
该扩展被剥离了浏览器功能,并作为社区的集成点发布,以便在边栏对话或编辑器、收藏夹、个性化等中的响应中继续使用GPT模型。
它的主要作用,是将 OpenAI ChatGPT 集成到 VSCode,提供了包括但不限于以下这些功能:
- 支持 GPT-4、GPT-3.5、GPT3 或 Codex 模型;
- 在侧边栏对话窗口中进行问答;
- 停止响应,减少 tokens 消耗;
- 一键生成文件或修复代码;
- 以 Markdown 格式,导出所有对话记录;
- 编辑和重发提示;
- 通过 ChatGPT 生成代码。
具体如下图:


openai-translator
Github: https://github.com/yetone/openai-translator
openai translator 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用.
作者开发了一个 Bob 的插件 bob-plugin-openai-translator 使用 ChatGPT API 在 macOS 上进行全局划词翻译。
但是由于很多用户并不是 macOS 用户,所以特此开发了一个浏览器插件方便非 macOS 用户使用 ChatGPT 进行划词翻译。
特性
- 支持三种翻译模式:翻译、润色、总结
- 支持 55 种语言的相互翻译、润色和总结功能
- 支持实时翻译、润色和总结,以最快的速度响应用户,让翻译、润色和总结的过程达到前所未有的流畅和顺滑
- 支持自定义翻译文本
- 支持一键复制
- 支持 TTS
- 有桌面端应用,全平台(Windows + macOS + Linux)支持!
- 同时支持 OpenAI 和 Azure OpenAI Service
具体如下图:



DocsGPT
Github: https://github.com/arc53/DocsGPT
DocsGPT是一个尖端的开源解决方案,它简化了在项目文档中查找信息的过程。通过集成强大的GPT模型,开发人员可以轻松地询问有关项目的问题并获得准确的答案。
告别耗时的手动搜索,让DocsGPT帮助您快速找到所需的信息。尝试一下,看看它是如何彻底改变您的项目文档体验的。为其发展做出贡献,并成为人工智能辅助未来的一部分。
具体如下图:



chatgpt-on-wechat
Github: https://github.com/zhayujie/chatgpt-on-wechat
chatgpt on wechat 使用ChatGPT搭建微信聊天机器人,基于GPT3.5 API和itchat实现。
已实现的特性如下:
- 文本对话: 接收私聊及群组中的微信消息,使用ChatGPT生成回复内容,完成自动回复
- 规则定制化: 支持私聊中按指定规则触发自动回复,支持对群组设置自动回复白名单
- 多账号: 支持多微信账号同时运行
- 图片生成: 支持根据描述生成图片,并自动发送至个人聊天或群聊
- 上下文记忆:支持多轮对话记忆,且为每个好友维护独立的上下会话
- 语音识别: 支持接收和处理语音消息,通过文字或语音回复
配置说明:
1.个人聊天
- 个人聊天中,需要以 "bot"或"@bot" 为开头的内容触发机器人,对应配置项 single_chat_prefix (如果不需要以前缀触发可以填写 "single_chat_prefix": [""])
- 机器人回复的内容会以 "[bot] " 作为前缀, 以区分真人,对应的配置项为 single_chat_reply_prefix (如果不需要前缀可以填写 "single_chat_reply_prefix": "")
2.群组聊天
- 群组聊天中,群名称需配置在 group_name_white_list 中才能开启群聊自动回复。如果想对所有群聊生效,可以直接填写 "group_name_white_list": ["ALL_GROUP"]
- 默认只要被人 @ 就会触发机器人自动回复;另外群聊天中只要检测到以 "@bot" 开头的内容,同样会自动回复(方便自己触发),这对应配置项 group_chat_prefix
- 可选配置: group_name_keyword_white_list配置项支持模糊匹配群名称,group_chat_keyword配置项则支持模糊匹配群消息内容,用法与上述两个配置项相同。(Contributed by evolay)
- group_chat_in_one_session:使群聊共享一个会话上下文,配置 ["ALL_GROUP"] 则作用于所有群聊
3.语音识别
- 添加 "speech_recognition": true 将开启语音识别,默认使用openai的whisper模型识别为文字,同时以文字回复,目前只支持私聊 (注意由于语音消息无法匹配前缀,一旦开启将对所有语音自动回复);
- 添加 "voice_reply_voice": true 将开启语音回复语音,但是需要配置对应语音合成平台的key,由于itchat协议的限制,只能发送语音mp3文件,若使用wechaty则回复的是微信语音。
4.其他配置
- model: 模型名称,目前支持 gpt-3.5-turbo, text-davinci-003, gpt-4, gpt-4-32k (其中gpt-4 api暂未开放)
- temperature,frequency_penalty,presence_penalty: Chat API接口参数,详情参考OpenAI官方文档。
- proxy:由于目前 openai 接口国内无法访问,需配置代理客户端的地址,详情参考 #351
- 对于图像生成,在满足个人或群组触发条件外,还需要额外的关键词前缀来触发,对应配置 image_create_prefix
- 关于OpenAI对话及图片接口的参数配置(内容自由度、回复字数限制、图片大小等),可以参考 对话接口 和 图像接口 文档直接在 代码 bot/openai/open_ai_bot.py 中进行调整。
- conversation_max_tokens:表示能够记忆的上下文最大字数(一问一答为一组对话,如果累积的对话字数超出限制,就会优先移除最早的一组对话)
- rate_limit_chatgpt,rate_limit_dalle:每分钟最高问答速率、画图速率,超速后排队按序处理。
- clear_memory_commands: 对话内指令,主动清空前文记忆,字符串数组可自定义指令别名。
- hot_reload: 程序退出后,暂存微信扫码状态,默认关闭。
- character_desc 配置中保存着你对机器人说的一段话,他会记住这段话并作为他的设定,你可以为他定制任何人格 (关于会话上下文的更多内容参考该 issue)
具体如下图:




Access-chatGPT-in-Siri
Github: https://github.com/Daiyimo/Access-chatGPT-in-Siri
Siri接入ChatGPT指南。目前仅限iPhone端及其他支持快捷指令的Apple产品,后续会更新Android版本。
具体如下图:


最后
一台电脑,一个键盘,尽情挥洒智慧的人生;几行数字,几个字母,认真编写生活的美好;
一 个灵感,一段程序,推动科技进步,促进社会发展。
创作不易,喜欢的老铁们加个关注,点个赞,打个赏,后面会不定期更新干货和技术相关的资讯,速速收藏,谢谢!你们的一个小小举动就是对小编的认可,更是创作的动力。