百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 文章教程 > 正文

在 MacBook Pro M1 上搭建 Chatgpt 自定义AI助手教程

xsobi 2024-12-06 20:28 17 浏览

Chatgpt在国内经常会遇到各种网络问题,而且一旦失去网络连接就无法使用。此外,Chatgpt是需要付费的。在2023年,GPT将迎来发展元年,我相信未来每个人都应该有自己的Chatgpt大模型,而不仅仅是大型机构才能拥有。

未来,对于Chatgpt大模型所需的计算能力,应该是人人都能负担得起的,就像现在的个人电脑一样。在这里,我主要讲解如何利用Facebook开源的LLAMA 7B大模型和llama.cpp开源代码,在Macbook Pro M1上构建一个能够运行的AI助手。

下面我们来逐步讲解。

第一步:下载 7B 的大模型

使用命令行方式下载

Bash
curl -o ggml-alpaca-7b-q4.bin -C - <https://gateway.estuary.tech/gw/ipfs/QmQ1bf2BTnYxq73MFJWu1B7bQ2UD6qG7D7YDCxhTndVkPC>

或是直接使用浏览器打开,下载完成后文件改名为 ggml-alpaca-7b-q4.bin:

Bash
<https://gateway.estuary.tech/gw/ipfs/QmQ1bf2BTnYxq73MFJWu1B7bQ2UD6qG7D7YDCxhTndVkPC>

第二步:下载llama.cpp

llama.cpp工程是基于Facebook的llama开源项目进行改进的。它通过使用C++进行推理,降低了资源需求,同时保持了高速处理的特点。

请使用 git clone 方式下载代码,以便以后轻松更新。当前项目更新速度较快。

git clone <https://github.com/ggerganov/llama.cpp.git>

第三步:编绎llama.cpp

进入llama.cpp,运行如下命令

make

如果没有报错则表示编绎成功了。

在目录下会生成如下几个可执行文件:main、quantize。其中,main是启动会话的程序,而quantize目前不需要使用。

第四步:将 ggml-alpaca-7b-q4.bin 放到llama.cpp/models目录下 第五步:完成一个启动脚本start.sh

先看看 main 能接受哪些参数:

(base) ?  llama.cpp git:(master) ? ./main -h
usage: ./main [options]

options:
  -h, --help            show this help message and exit
  -i, --interactive     run in interactive mode
  -ins, --instruct      run in instruction mode (use with Alpaca models)
  -r PROMPT, --reverse-prompt PROMPT
                        in interactive mode, poll user input upon seeing PROMPT (can be
                        specified more than once for multiple prompts).
  --color               colorise output to distinguish prompt and user input from generations
  -s SEED, --seed SEED  RNG seed (default: -1)
  -t N, --threads N     number of threads to use during computation (default: 4)
  -p PROMPT, --prompt PROMPT
                        prompt to start generation with (default: empty)
  --random-prompt       start with a randomized prompt.
  -f FNAME, --file FNAME
                        prompt file to start generation.
  -n N, --n_predict N   number of tokens to predict (default: 128)
  --top_k N             top-k sampling (default: 40)
  --top_p N             top-p sampling (default: 0.9)
  --repeat_last_n N     last n tokens to consider for penalize (default: 64)
  --repeat_penalty N    penalize repeat sequence of tokens (default: 1.3)
  -c N, --ctx_size N    size of the prompt context (default: 512)
  --ignore-eos          ignore end of stream token and continue generating
  --memory_f16          use f16 instead of f32 for memory key+value
  --temp N              temperature (default: 0.8)
  -b N, --batch_size N  batch size for prompt processing (default: 8)
  -m FNAME, --model FNAME
                        model path (default: models/llama-7B/ggml-model.bin)

我们主要使用交互模式,并将可预测的令牌数设置为512,因此请按以下命令操作:

./main -m ./models/ggml-alpaca-7b-q4.bin --color -ins -r "Me:" -n 512

启动后的界面如下:

开始使用:

先提一个问题:“how to Implementing Gradient Ascent with python?”

生成的答案如下,相比chatgpt有点简陋。

毕竟模型只有7B的参数,如果换到65B,应该效果会好很多。不过已经非常好了,相信未来继续优化后会更好。

相关推荐

我把家搬进了NAS?家庭资产数字化革命,现在连袜子都有编号了!

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:羊刀仙家里东西一多,总有一种“我记得我有这个,但我不知道放哪了”的错觉。...

Mega Run第3关通关攻略-跳上高空(mega运动)

错过火炮等于失败,这是MegaRun在上一关中给玩家的一点小挑战,那在后面的关卡中,这中挑战会给你造成什么困难呢?具体请看MegaRun第3关通关攻略-跳上高空。MegaRun第3关在一开始我...

Axure高保真教程:中继器表格自动合计模板

编辑导语:合计作为日常使用频率比较高的一个功能,但在Axure里面传统的表格如果做合计是很麻烦的,遇到数据多的时候很耗费时间,那么该如何优化,提高工作效率?本文以中继器表格为核心,教大家如何制作一个自...

多角色登录原型(分角色登录)

编辑导读:多角色登录是很多系统都需要具备的功能,例如在招聘网站里,登录的角色包括、求职者、招聘企业的hr、猎头、内部员工等等。本文作者分享了如何在Axure里面制作多角色登录的原型模板,希望对你有帮助...

利用Axure+js创建可配置地图页面(axure地址选择)

编辑导语:如何利用Axure实现自定义地图展示?本篇文章里,作者结合Axure与高德地图,对如何在Axure中设置相应参数、进而预览时实现自定义地图展示效果的操作流程进行了示范和总结,一起来看一下。本...

纬地智能模板的一些基础与概念(纬地智能模板的一些基础与概念是什么)

对于公路及相关土木工程的勘测设计工作,虽然基础的理论和方法是基本相同的,但是受到各国家、地区文化、制图习惯等方面因素的影响,不同地域公路勘测设计的习惯和表达方式有着很大的差异,当然语言方面的不同和差...

WPF界面开发第三方控件入门指南——菜单项

点击“了解更多”获取工具DevExpressWPFSubscription拥有120+个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpressWPF能创建有着强...

鸿蒙开发:自定义一个搜索模版(鸿蒙系统怎么添加百度搜索条)

前言代码案例基于Api13。...

简单介绍一下前端各框架中的模板标签

在各大前端框架、小程序中,此类标签的作用主要是用来帮助我们包裹多个元素。在浏览器实际渲染中会将其移除只渲染其包裹的DOM元素,所以说不会增加额外的DOM节点...

法媒:简单的几个步骤让你的运动鞋更加炫酷

【环球网综合报道】有没有觉得自己的运动鞋样式单调,希望它变得更加炫酷?法媒《ELLE》推荐了一种简单易行的装饰方法,让您的运动鞋更加时尚。制作前,您需要准备一张细毡子、一张闪光热胶合布、胶水、两个银夹...

Blazor 代码隐藏(blazor 操作dom)

Razor组件通常是在单个.razor文件中创作的,这样就存在页面中包含html代码和后台代码(@code标记指定的代码)。如下...

DevExpress WPF入门指南:DXBars, DXRibbon中使用MVVM的两种方式

你也可以下载Universal安装包或者到DevExpress中文网查看更多示例和教程哦本文档介绍在DXBars,DXRibbon和GalleryControl这三个控件中使用MVVM框架的...

干货,Uploadfive插件上传,Python接收存储

在Web开发工作中,经常遇到上传需求,上传照片,文件等,网上的上传插件有很多,我使用的是一款H5上传插件Uploadfive,与之对应的是Uploadify,后者是基于Flash的,不过现在越来越多的...

用DevExpress实现基于HTML&amp;CSS的桌面应用程序的UI(二)

DevExpressWinForm拥有180+组件和UI库,能为WindowsForms...

Avalonia:一个开源的跨平台UI选项

...