오늘날 급속한 기술 발전 시대에 인공 지능 분야의 모든 혁신은 기술계에 큰 파장을 일으킬 수 있습니다. 외국 AI 거대 기업과 쇼핑 기업이 출시한 cloud3.5 모델은 다시 한번 전체 기술계를 새롭게 했습니다. 왜? 즉, API와 일반 인공지능을 활용해 일반 컴퓨터를 진짜 '자비스'로 변신시킬 수 있다는 것이다.
이제 평소대로 컴퓨터에 "다음 주 화요일부터 목요일까지 시애틀에서 샌프란시스코까지의 항공편을 찾아주세요"와 같은 문장만 말하면 컴퓨터가 자동으로 항공편 검색 웹사이트를 열고 주소와 정보를 입력하도록 도와줍니다. 찾다. 당신이 원하는 비행정보, 아이언맨 자비스의 실사판이 아닌가, 놀랍습니다.
하지만 그렇게 강력한 "자비스"는 어떻게 그 일을 할 수 있을까요? 다행스럽게도 UNSHI는 구현 소스 코드를 공개했습니다. 구체적인 단계를 살펴보겠습니다.
프로젝트의 성공적인 시작은 단지 첫 번째 단계일 뿐입니다. 더 논의할 가치가 있는 것은 그 구현 원칙이다. 전체 프로젝트는 크로스 플랫폼 데스크톱 애플리케이션 개발 프레임워크인 ELE를 사용합니다(여기서 원본 텍스트에 오타가 있을 수 있으며 아마도 Electron과 같은 개발 프레임워크인 것 같습니다). SRC 폴더의 기본 폴더를 엽니다. 여기에는 주로 창 생성 및 관리를 담당하는 Electron 애플리케이션의 주요 프로세스 코드가 저장됩니다. render 폴더에는 왼쪽 상단 모서리에 있는 해당 사각형을 렌더링하기 위한 코드가 저장되어 있습니다. 내부 버튼은 페이지의 "Let's go"(작업 시작 버튼)입니다.
작업 시작 버튼을 클릭하면 "lang Agent" 메서드가 트리거되어(이는 자료의 특정 용어일 수도 있고 "lang Agent"와 같은 철자 오류일 수도 있음) 컴퓨터가 Jarvis 생각을 하게 만듭니다. . 기능에 대한 핵심 접근 방식. 먼저 사용자의 채팅 콘텐츠를 얻은 다음 강력한 인간-컴퓨터 상호 작용 기능을 갖춘 ENOPIC의 최신 cloud3.5 듀얼 네트워크 모델을 호출합니다. 이후, 모델은 스크린샷을 찍어 현재 사용자의 화면 내용을 학습하고, 모델은 해당 작업 지침을 반환합니다. 이러한 작업 지침은 매우 중요합니다. 컴퓨터를 작동하는 "JARVIS"로 만든 것은 바로 그들이었습니다.
예를 들어, "moss move" 명령은 마우스가 지정된 XY 축 좌표 위치로 이동해야 함을 컴퓨터에 지시합니다. "left-click jack" 명령은 컴퓨터에 마우스 오른쪽 버튼을 클릭하고 지정된 좌표 위치로 드래그하도록 지시합니다. . 그 밖에도 커서 위치 지시, 왼쪽 마우스 클릭 지시, 오른쪽 마우스 클릭 지시, 가운데 마우스 클릭 지시, 마우스 더블 클릭 지시, 키보드 키 지시 등이 있습니다. 각 지시가 실행된 후 스크린샷이 다시 촬영되며 클라우드3 .5 모델은 최종 모델이 작업 완료 여부를 결정할 때까지 사용자의 작업을 완료하라는 지침을 계속 발행할 수 있도록 알림을 받습니다. 완료되면 FINNISH가 반환됩니다. 이 유형의 명령은 작업이 완료되었으며 전체 프로그램이 종료됨을 나타냅니다.
어때요? 흥미롭지 않나요? 관심 있는 학생들은 코드를 다운로드하여 자신만의 Jarvis를 개발할 수 있습니다. 그 과정에서 이해가 안 되는 부분이 있으면 댓글란에 적어서 함께 토론하셔도 됩니다. 프로그래밍에 대한 탐구를 통해 뭔가를 얻을 수 있기를 바라며, 최첨단 프로그래밍 지식에 대해 더 많이 배울 수 있도록 저를 팔로우하는 것도 잊지 마세요. 다음에 또 만나요.
Jarvis의 발전에 대해 어떻게 생각하시나요? 댓글 섹션에 오셔서 여러분의 생각을 공유해 보세요. 이 글이 좋다고 생각하신다면, 프로그래밍에 관심이 있는 친구들에게도 공유해주세요.
트위터에 공유 페이스북에 공유
코멘트
현재 댓글이 없습니다