logo
0
0
WeChat Login

AI游戏控制器

基于大语言模型的游戏AI控制器,可以分析游戏截图并自动生成操作指令。

功能特性

  • 智能游戏控制: 通过分析游戏截图自动生成操作指令
  • 完整键盘映射: 支持105+键,包括字母、数字、功能键、方向键、修饰键、符号键、小键盘等
  • 双驱动系统: Python驱动(默认)和C驱动(高性能)可选
  • AI握手协议: 启动时通过握手确保指令格式正确
  • 鼠标支持: 支持鼠标移动和点击操作
  • 过程截图记录: 可选保存过程截图到tmp目录,默认保留最新50张

系统要求

  • Windows 10/11
  • Python 3.8+
  • OpenAI API密钥

安装

  1. 安装Python依赖:
pip install -r requirements.txt
  1. 配置API密钥: 编辑 config.ini,填入你的OpenAI API密钥:
[api] api_key = your_api_key_here

使用方法

启动程序

python run.py

操作方式

程序启动后会显示倒计时,倒计时结束后进入等待状态:

  • 空格键:截图并由AI分析,执行返回的指令
  • q 键:退出程序
  • Ctrl+C:强制退出程序

启动倒计时

config.ini 中设置倒计时秒数:

[control] countdown_seconds = 5 # 启动倒计时(秒)

驱动选择

config.ini 中选择驱动类型:

Python驱动(默认):

[driver] type = python

C驱动(高性能):

[driver] type = c dll_path = virtual_driver.dll

支持的指令

按键指令

press w # 按下并释放w键 hold shift # 按住shift键 release shift # 释放shift键

鼠标指令

mouse 100 200 # 移动鼠标到(100,200) click left # 左键点击 click right # 右键点击 click middle # 中键点击

支持的按键

  • 字母键: a-z
  • 数字键: 0-9
  • 功能键: f1-f12
  • 方向键: up, down, left, right
  • 特殊键: space, enter, tab, escape, backspace, delete, insert, home, end, pageup, pagedown
  • 修饰键: shift, ctrl, alt, lshift, rshift, lctrl, rctrl, lalt, ralt
  • 符号键: -, =, [, ], , ;, ', ,, ., /, `, ~
  • 小键盘: numpad0-9, numpad_multiply, numpad_add, numpad_subtract, numpad_decimal, numpad_divide, numpad_enter
  • 其他: capslock, numlock, scrolllock, printscreen, pause

配置说明

config.ini 配置项:

[api] api_key = your_api_key_here # OpenAI API密钥 api_base = https://api.openai.com/v1 # API基础URL model = gpt-4-vision-preview # 使用的模型 max_tokens = 500 # 最大生成token数 temperature = 0.7 # 温度参数 [driver] type = python # 驱动类型: python 或 c dll_path = virtual_driver.dll # C驱动DLL路径 [ai] handshake_prompt_enabled = true # 是否启用握手提示词 instruction_format = line_by_line # 指令格式 [capture] screenshot_interval = 0.5 # 截图间隔(秒)- 已废弃,现在改为按需触发 capture_region = full_screen # 截图区域 save_screenshots = true # 是否保存截图到tmp目录 max_screenshot_count = 50 # 最大保留截图数量(0=不保存) [control] countdown_seconds = 5 # 启动倒计时(秒)

快速开始

  1. 安装依赖:
pip install -r requirements.txt
  1. 配置API密钥:
# 编辑 config.ini,填入你的OpenAI API密钥
  1. 启动程序:
python main.py
  1. 按Ctrl+C停止程序

项目结构

. ├── main.py # 主程序 ├── api_client.py # API客户端 ├── driver.py # Python驱动 ├── c_driver_wrapper.py # C驱动包装器 ├── virtual_driver.dll # C驱动DLL ├── config.ini # 配置文件 ├── requirements.txt # Python依赖 └── README.md # 本文档

技术细节

Python驱动

  • 使用pywin32和pydirectinput库
  • 跨平台兼容性好
  • 适合一般使用场景

C驱动

  • 使用Windows SendInput API
  • 高性能,低延迟
  • 通过ctypes加载DLL
  • 静态链接,无需安装

AI握手协议

启动时向AI发送标准化提示词,确保AI理解指令格式并只返回指令,不返回额外解释。

注意事项

  1. 确保游戏窗口在前台运行
  2. 根据游戏调整截图间隔
  3. 使用C驱动可以获得更好的性能
  4. 建议使用GPT-4V模型以获得最佳效果
  5. 过程截图保存在tmp目录,会自动清理旧截图
  6. 如果不需要保存截图,设置max_screenshot_count为0

许可证

MIT License