(0 のコメント)
今日の急速な技術開発の時代では、人工知能の分野におけるあらゆる画期的な進歩が技術界に波を起こす可能性があります。外国のAI大手やショッピング企業がリリースしたcloud3.5モデルは、テクノロジー界全体を再びリフレッシュさせた。なぜ?つまり、APIと一般的な人工知能を使用して、普通のコンピューターを本物の「ジャービス」に変えることができます。
いつものようにコンピューターに「来週の火曜日から木曜日のシアトル発サンフランシスコ行きのフライトを検索」などの文を伝えるだけで、コンピューターが自動的にフライト検索 Web サイトを開き、住所と情報の入力を支援します。検索。あなたが欲しいフライト情報、これはアイアンマン・ジャービスの実写版ではないでしょうか、すごいですね。
しかし、これほど強力な「ジャーヴィス」はどうやってそれを行うのでしょうか?幸いなことに、UNSHI はその実装ソース コードを公開しています。具体的な手順を見てみましょう。
プロジェクトの立ち上げが成功することは最初のステップにすぎません。さらに議論に値するのは、その実施原理である。プロジェクト全体では、クロスプラットフォームのデスクトップ アプリケーション開発フレームワークである ELE を使用しています (原文にはタイプミスがある可能性があります。おそらく Electron などの開発フレームワークです)。 SRC フォルダー内のメイン フォルダーを開きます。ここには、主にウィンドウの作成と管理を担当する Electron アプリケーションのメイン プロセス コードが保存されます。レンダリング フォルダーには、左上隅の対応する正方形をレンダリングするためのコードが保存されています。中のボタンはページ上の「Let's go」(タスク開始ボタン)です。
タスクの開始ボタンをクリックすると、「lang エージェント」メソッドがトリガーされます (これは、資料内の特定の用語である可能性もあれば、「lang エージェント」などのスペルミスである可能性もあります)。これにより、コンピューターはジャービスの思考を働かせます。 。機能に対する核となるアプローチ。まずユーザーのチャット コンテンツを取得し、次に強力な人間とコンピューターの対話機能を持つ ENOPIC の最新の Cloud3.5 デュアル ネットワーク モデルを呼び出します。その後、モデルはスクリーンショットを撮ることで現在のユーザーの画面コンテンツを学習し、対応するアクション指示を返します。これらの行動指示は非常に重要です。コンピューターを実用的な「JARVIS」に変えたのは彼らでした。
たとえば、「moss move」コマンドは、マウスを指定された XY 軸座標位置に移動するようにコンピューターに指示し、「left-click jack」コマンドは、現在のコンテンツを右クリックして指定された座標位置にドラッグするようにコンピューターに指示します。 。さらに、カーソル位置の指示、マウスの左クリックの指示、マウスの右クリックの指示、マウスの中クリックの指示、マウスのダブルクリックの指示、キーボードのキーの指示などがあります。各指示の実行後、スクリーンショットが撮り直され、クラウド3 .5 モデルは、最終モデルがタスクが完了したかどうかを判断するまで、ユーザーのタスクを完了するための指示を発行し続けることができるように通知されます。完了すると、FINNISH が返されます。このタイプの命令は、タスクが完了し、プログラム全体が終了することを示します。
どうでしょうか?面白くないですか?興味のある学生はコードをダウンロードして、独自の Jarvis を開発できます。途中でわからないことがあれば、コメント欄に書いて一緒に話し合うこともできます。プログラミングの探求から何かを得ることができれば幸いです。また、最先端のプログラミング知識をさらに学ぶことができるように、私をフォローすることを忘れないでください。次回お会いしましょう。
ジャービスの成長についてどう思いますか?ぜひコメント欄であなたの考えを共有してください。この記事が良いと思ったら、同じくプログラミングに興味のある友達にもシェアしてください。
Twitterでシェアする Facebookでシェア
コメント
現在コメントはありません