Astronaut-Leica/Eggy_AI

Public

WeChat Login

Code Issues Pull requests Events Packages Insights

main

Eggy_AI/doc/README.md

宇航员徕卡

5003d17b

PreviewCode viewBlame

AI游戏控制器

基于大语言模型的游戏AI控制器，可以分析游戏截图并自动生成操作指令。

功能特性

智能游戏控制: 通过分析游戏截图自动生成操作指令
完整键盘映射: 支持105+键，包括字母、数字、功能键、方向键、修饰键、符号键、小键盘等
双驱动系统: Python驱动（默认）和C驱动（高性能）可选
AI握手协议: 启动时通过握手确保指令格式正确
鼠标支持: 支持鼠标移动和点击操作
过程截图记录: 可选保存过程截图到tmp目录，默认保留最新50张

系统要求

Windows 10/11
Python 3.8+
OpenAI API密钥

安装

安装Python依赖:


pip install -r requirements.txt

配置API密钥: 编辑 config.ini，填入你的OpenAI API密钥:


[api]
api_key = your_api_key_here

使用方法

启动程序


python run.py

操作方式

程序启动后会显示倒计时，倒计时结束后进入等待状态：

按 空格键：截图并由AI分析，执行返回的指令
按 q 键：退出程序
按 Ctrl+C：强制退出程序

启动倒计时

在 config.ini 中设置倒计时秒数：


[control]
countdown_seconds = 5  # 启动倒计时（秒）

驱动选择

在 config.ini 中选择驱动类型:

Python驱动（默认）:


[driver]
type = python

C驱动（高性能）:


[driver]
type = c
dll_path = virtual_driver.dll

支持的指令

按键指令


press w          # 按下并释放w键
hold shift       # 按住shift键
release shift    # 释放shift键

鼠标指令


mouse 100 200    # 移动鼠标到(100,200)
click left       # 左键点击
click right      # 右键点击
click middle     # 中键点击

支持的按键

字母键: a-z
数字键: 0-9
功能键: f1-f12
方向键: up, down, left, right
特殊键: space, enter, tab, escape, backspace, delete, insert, home, end, pageup, pagedown
修饰键: shift, ctrl, alt, lshift, rshift, lctrl, rctrl, lalt, ralt
符号键: -, =, [, ], , ;, ', ,, ., /, `, ~
小键盘: numpad0-9, numpad_multiply, numpad_add, numpad_subtract, numpad_decimal, numpad_divide, numpad_enter
其他: capslock, numlock, scrolllock, printscreen, pause

配置说明

config.ini 配置项:


[api]
api_key = your_api_key_here          # OpenAI API密钥
api_base = https://api.openai.com/v1 # API基础URL
model = gpt-4-vision-preview         # 使用的模型
max_tokens = 500                     # 最大生成token数
temperature = 0.7                    # 温度参数

[driver]
type = python                        # 驱动类型: python 或 c
dll_path = virtual_driver.dll        # C驱动DLL路径

[ai]
handshake_prompt_enabled = true      # 是否启用握手提示词
instruction_format = line_by_line    # 指令格式

[capture]
screenshot_interval = 0.5            # 截图间隔（秒）- 已废弃，现在改为按需触发
capture_region = full_screen         # 截图区域
save_screenshots = true              # 是否保存截图到tmp目录
max_screenshot_count = 50            # 最大保留截图数量（0=不保存）

[control]
countdown_seconds = 5                # 启动倒计时（秒）

快速开始

安装依赖:


pip install -r requirements.txt

配置API密钥:


# 编辑 config.ini，填入你的OpenAI API密钥

启动程序:


python main.py

按Ctrl+C停止程序

项目结构


.
├── main.py                 # 主程序
├── api_client.py           # API客户端
├── driver.py               # Python驱动
├── c_driver_wrapper.py     # C驱动包装器
├── virtual_driver.dll      # C驱动DLL
├── config.ini              # 配置文件
├── requirements.txt        # Python依赖
└── README.md               # 本文档

技术细节

Python驱动

使用pywin32和pydirectinput库
跨平台兼容性好
适合一般使用场景

C驱动

使用Windows SendInput API
高性能，低延迟
通过ctypes加载DLL
静态链接，无需安装

AI握手协议

启动时向AI发送标准化提示词，确保AI理解指令格式并只返回指令，不返回额外解释。

注意事项

确保游戏窗口在前台运行
根据游戏调整截图间隔
使用C驱动可以获得更好的性能
建议使用GPT-4V模型以获得最佳效果
过程截图保存在tmp目录，会自动清理旧截图
如果不需要保存截图，设置max_screenshot_count为0

许可证

MIT License

35/F,Tencent Building,Kejizhongyi Avenue,Nanshan District,Shenzhen

京ICP备11018762号-111