程序员教你开发贾维斯

(0 comments)

向程序员学习开发Jarvis,解锁智能电脑新体验

在当今科技飞速发展的时代,人工智能领域的每一次突破都能在科技圈掀起波澜。国外AI巨头和shopic公司发布的cloud3.5模型再次刷新了整个科技圈。为什么?即它可以将一台普通计算机改造成具有API和通用人工智能的真正的“贾维斯”。

1.类似贾维斯的神奇功能展示

现在你只需要像往常一样告诉计算机一句话,比如“查找下周二至周四从西雅图飞往旧金山的航班”,计算机就会自动打开航班搜索网站,同时还会帮你输入地址和信息。搜索。你想要的航班信息,这不就是现实版的钢铁侠贾维斯吗,真是太神奇了。

2.开发Jarvis的具体步骤

但如此强大的“贾维斯”是如何做到的呢?幸运的是,UNSHI已经发布了其实现源代码。我们来看看具体步骤。

  1. 下载源码:进入GITHUB源码地址,滑动到下面的启动文档,先复制get clo命令,然后粘贴到命令行中即可下载项目的源码。 2、进入项目:下载源码后,复制光盘命令进入项目,为后续操作做准备。
  2. 安装依赖:复制npm install命令安装项目的依赖,使项目具备运行的基本条件。
  3. 创建环境变量:依赖安装完成后,复制dot V dot示例文件,创建环境变量dot UV。创建文件后,您会发现enoppic API密钥存储在其中。这个可以用来调用AOPPIC的AI大模型的关键非常重要。
  4. 启动项目:完成前面的步骤后,复制npm start命令并在命令行中运行。这时候看右上角,项目就启动成功了。

3.揭示项目实施原理

项目的成功启动只是第一步。更值得探讨的是它的实现原理。整个项目使用了一个跨平台的桌面应用开发框架——ELE(这里原文可能有错别字,推测是Electron等开发框架)。我们打开SRC文件夹中的主文件夹。这里存放的是Electron应用程序的主流程代码,主要负责创建和管理窗口。 render文件夹中存放的是渲染左上角对应方块的代码。里面的按钮按钮就是页面上的“Let's go”(开始任务按钮)。

当我们点击启动任务按钮时,就会触发“lang代理”方法(这也可能是材料中的特定术语,也可能是“lang代理”等拼写错误),这使得计算机具有Jarvis思维。能力的核心方法。它首先获取用户的聊天内容,然后调用ENOPIC最新的cloud3.5双网模型,具有强大的人机交互能力。之后,模型通过截图的方式获知当前用户的屏幕内容,模型会返回相应的动作指令。这些行动指示非常重要。正是他们将计算机变成了一个可以工作的“贾维斯”。

例如“moss move”命令告诉计算机鼠标应该移动到指定的XY轴坐标位置; “左键杰克”命令告诉计算机右键单击并将当前内容拖动到指定的坐标位置。另外,还有光标位置指令、鼠标左键单击指令、鼠标右键单击指令、鼠标中键单击指令、鼠标双击指令、键盘按键指令等,每条指令执行完毕后,都会重新进行截图,并且cloud3.5模型会得到通知,以便它可以继续发出指令来完成用户的任务,直到最终模型确定任务是否完成。完成后,将返回 FINNISH。该类型的指令表明任务已经完成,整个程序将终止。

怎么样?是不是很有趣?有兴趣的同学可以下载代码,自己开发自己的Jarvis。如果过程中有什么不明白的地方,也可以写在评论区,一起讨论。希望大家能够在编程的探索中有所收获,也别忘了给我点个大大的关注,以便大家了解更多前沿的编程知识。下一期见。

对于贾维斯的发展你怎么看?快来评论区分享你的想法吧。如果您觉得这篇文章不错,欢迎分享给身边同样对编程感兴趣的朋友。

目前未评级

评论


目前没有任何评论

发表评论前请先登录: 登录

最近的帖子

档案

2025
2024
2023
2022
2021
2020

类别

标签

作者

饲料

RSS / 原子