
### **用先进的 AI 技术保持您的 Minecraft 服务器聊天干净安全!**
AI Chat Moderation 是一个强大的插件,它使用人工智能来检测和过滤您 Minecraft 服务器聊天中的有害消息。 通过可定制的检测类别和响应操作,您可以为所有玩家创建一个温馨的环境。
_该插件使用 OPENAI 或 Mistral AI 模型,无需 API 密钥_
## 特性
- 高级 AI 检测: 识别 12 类有害内容,包括骚扰、仇恨言论、威胁、暴力和不适当的性内容,适用于所有语言。
- 可定制的置信度级别: 调整每个类别的检测灵敏度
- 灵活的响应系统: 为不同类型的违规行为配置独特的响应
- 实时审核: 选择在发送之前或之后检查消息
- 全面的日志记录: 跟踪服务器控制台中标记的消息
- 易于配置: 具有详细选项的简单 YAML 文件
## 安装
只需将插件 jar 文件拖放到您的插件文件夹中即可!
无需创建 OPENAI 密钥。 为了消除任何疑虑,消息可能被缓存到我的程序中,仅用于性能目的。
## 工作原理
该插件使用 AI 技术分析每条聊天消息,以确定它是否包含有害内容。 当检测到潜在有害内容时,该插件可以:
- 隐藏其他玩家的消息
- 向违规玩家发送警告消息
- 基于违规类型执行自定义命令
- 对严重违规行为进行踢出或其他管理操作
为您的版主提供他们需要的工具,以维护积极的社区,而无需不断监控聊天。 AI Chat Moderation 在后台默默运行,让您可以专注于构建和游戏,同时确保服务器对每个人都是安全的。
## 命令
- /acm reload : 重新加载插件
- /acm debug : 查看每个发送消息的类别置信度。 它可以轻松调整您的类别置信度。
## 权限
- acm.reload : 能够使用 /acm reload
- acm.debug : 能够使用 /acm debug
- acm.bypass : 绕过检查 (**默认 OP 绕过**)
_AI Chat Moderation - 为您的 Minecraft 社区提供智能保护_
配置文件:
```yaml
# 启用或禁用插件
enabled: true
# ---- 无 AI 部分 ----
# 为了在不使用 AI 的情况下黑名单一些词语
blacklisted-words:
- fuck you
- retarded
# 消息是否在包含黑名单词语时被隐藏
blacklisted-words-hide-message: true
# 如果消息包含黑名单词语,将运行的命令
blacklisted-words-commands:
- "SEND_MESSAGE &6%player% &c请使用正确的语言。"
# ---- AI 部分 ----
# 选择您的提供商 OPENAI 或 MISTRAL 或 DETOXIFY
# + Mistral 更适合阿拉伯语和俄语
# + OpenAI 响应更快
# + Detoxify 速度非常快,适合 IT、FR、RU、PT、ES、TR,但当侮辱被拆分/未写好/缩写时,检测效果不佳
providers: [DETOXIFY, OPENAI]
# True: 插件将在控制台中记录标记的消息
# False: 插件将不会在控制台中记录标记的消息
logs-flagged-messages: true
logged-message-format: "Flagged message: Player:[%player%] - Message:[%message%] - Category:[%category%] - Confidence[%confidence%]"
# True: 插件将在消息发送之前检查消息(消息会有轻微延迟,大约 0.3s)
# False: 插件将在消息发送后检查消息(消息将不会延迟),但是如果消息被标记,消息将不会被删除
check-after-message-has-been-sent: false
# 插件可以检测的不同有害类别
categories:
# OPENAI
illicit/violent:
# True: 插件将检测此类别中的消息
# False: 插件将不会检测此类别中的消息
detection: true
# 插件在检测到此类别中的消息时执行的操作
actions:
warn:
# 调整置信度级别以检测此类别中的消息
# 如果更高,插件将仅检测具有高强度危害的消息
# 如果更低,插件将检测低强度危害的消息
# 从 0.0 到 1.0,0.85 是一个好值
confidence: 0.80
# 插件是否将从玩家处隐藏消息
hideMessage: true
# 插件在检测到此类别中的消息时执行的命令
# 占位符:%player%:发送消息的玩家
# %player_uuid%:发送消息的玩家的 UUID
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。"
other:
confidence: 0.95
hideMessage: true
commands:
- "kick %player%"
# OPENAI
self-harm/instructions:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用自我伤害指令。"
# OPENAI
harassment:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许骚扰其他玩家。"
# OPENAI
violence/graphic:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用暴力。"
# OPENAI
illicit:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用不正当语言。"
# OPENAI
self-harm/intent:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用自我伤害意图。"
# OPENAI
hate/threatening:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。"
# OPENAI
sexual/minors:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用性语言。"
# OPENAI
harassment/threatening:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。"
# OPENAI
hate:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用仇恨语言。"
# OPENAI
self-harm:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用自我伤害语言。"
# OPENAI 和 MISTRAL
sexual:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用性语言。"
# OPENAI
violence:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。"
# MISTRAL
# 表达对基于保护特征(如种族、民族、宗教、性别、性取向或残疾)的个人或群体表现出偏见、敌意或倡导歧视的内容。 这包括侮辱性词语、非人化语言、针对特定群体的排斥或伤害呼吁,以及基于这些特征持续骚扰或欺凌个人。
hate_and_discrimination:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用仇恨语言。"
# MISTRAL
# 描述、美化、煽动或威胁针对个人或群体的身体暴力。 这包括伤病或死亡的生动描述、明确的伤害威胁以及执行暴力行为的说明。 此类别涵盖有针对性的威胁和一般宣扬或美化暴力。
violence_and_threats:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。"
# MISTRAL
# 推广或提供关于非法活动或可能造成严重身体伤害、死亡或法律后果的极端危险行为的指导。 这包括关于制造武器或爆炸物、鼓励冒险行为、推广非暴力犯罪(如欺诈、盗窃或贩毒)的指导。
dangerous_and_criminal_content:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。"
# MISTRAL
# 推广、指导、计划或鼓励故意自我伤害、自杀、饮食失调或其他自我破坏行为。 这包括详细的方法、美化、自杀意图声明、危险挑战和相关俚语术语。
selfharm:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。"
# MISTRAL
# 包含或试图获得详细的或定制的医疗建议的内容
health:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用带有定制的医疗语言。"
# MISTRAL
# 包含或试图获得详细的或定制的财务建议的内容。
financial:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用财务语言。"
# MISTRAL
# 包含或试图获得详细的或定制的法律建议的内容。
law:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用带详细语言。"
# MISTRAL
# 包含或试图获得个人身份信息(如全名、地址、电话号码、社会安全号码或财务账户详细信息)的内容。
pii:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许泄露个人信息。"
# DETOXIFY
toxicity:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用有毒语言。"
# DETOXIFY
sexual_explicit:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用性显语言。"
# DETOXIFY
severe_toxicity:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用严重有毒语言。"
# DETOXIFY
obscene:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用粗俗语言。"
# DETOXIFY
threat:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。"
# DETOXIFY
identity_attack:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。"
# DETOXIFY
insult:
detection: true
actions:
warn:
confidence: 0.80
hideMessage: true
commands:
- "SEND_MESSAGE &6%player% &c您不允许使用辱骂性语言。"
print-api-errors: false # 为了调试目的,我建议在生产环境中将其设置为 false