AI Chat Moderation

AI 驱动的聊天审核插件,防止你的玩家发送有害内容。

资源图片
![AI Chat Moderation logo banner](https://imgur.com/IQT8E34.png)
### **用先进的 AI 技术保持您的 Minecraft 服务器聊天干净安全!** AI Chat Moderation 是一个强大的插件,它使用人工智能来检测和过滤您 Minecraft 服务器聊天中的有害消息。 通过可定制的检测类别和响应操作,您可以为所有玩家创建一个温馨的环境。 _该插件使用 OPENAI 或 Mistral AI 模型,无需 API 密钥_ ## 特性 - 高级 AI 检测: 识别 12 类有害内容,包括骚扰、仇恨言论、威胁、暴力和不适当的性内容,适用于所有语言。 - 可定制的置信度级别: 调整每个类别的检测灵敏度 - 灵活的响应系统: 为不同类型的违规行为配置独特的响应 - 实时审核: 选择在发送之前或之后检查消息 - 全面的日志记录: 跟踪服务器控制台中标记的消息 - 易于配置: 具有详细选项的简单 YAML 文件 ## 安装 只需将插件 jar 文件拖放到您的插件文件夹中即可! 无需创建 OPENAI 密钥。 为了消除任何疑虑,消息可能被缓存到我的程序中,仅用于性能目的。 ## 工作原理 该插件使用 AI 技术分析每条聊天消息,以确定它是否包含有害内容。 当检测到潜在有害内容时,该插件可以: - 隐藏其他玩家的消息 - 向违规玩家发送警告消息 - 基于违规类型执行自定义命令 - 对严重违规行为进行踢出或其他管理操作 为您的版主提供他们需要的工具,以维护积极的社区,而无需不断监控聊天。 AI Chat Moderation 在后台默默运行,让您可以专注于构建和游戏,同时确保服务器对每个人都是安全的。 ## 命令 - /acm reload : 重新加载插件 - /acm debug : 查看每个发送消息的类别置信度。 它可以轻松调整您的类别置信度。 ## 权限 - acm.reload : 能够使用 /acm reload - acm.debug : 能够使用 /acm debug - acm.bypass : 绕过检查 (**默认 OP 绕过**) _AI Chat Moderation - 为您的 Minecraft 社区提供智能保护_ 配置文件: ```yaml # 启用或禁用插件 enabled: true # ---- 无 AI 部分 ---- # 为了在不使用 AI 的情况下黑名单一些词语 blacklisted-words: - fuck you - retarded # 消息是否在包含黑名单词语时被隐藏 blacklisted-words-hide-message: true # 如果消息包含黑名单词语,将运行的命令 blacklisted-words-commands: - "SEND_MESSAGE &6%player% &c请使用正确的语言。" # ---- AI 部分 ---- # 选择您的提供商 OPENAI 或 MISTRAL 或 DETOXIFY # + Mistral 更适合阿拉伯语和俄语 # + OpenAI 响应更快 # + Detoxify 速度非常快,适合 IT、FR、RU、PT、ES、TR,但当侮辱被拆分/未写好/缩写时,检测效果不佳 providers: [DETOXIFY, OPENAI] # True: 插件将在控制台中记录标记的消息 # False: 插件将不会在控制台中记录标记的消息 logs-flagged-messages: true logged-message-format: "Flagged message: Player:[%player%] - Message:[%message%] - Category:[%category%] - Confidence[%confidence%]" # True: 插件将在消息发送之前检查消息(消息会有轻微延迟,大约 0.3s) # False: 插件将在消息发送后检查消息(消息将不会延迟),但是如果消息被标记,消息将不会被删除 check-after-message-has-been-sent: false # 插件可以检测的不同有害类别 categories: # OPENAI illicit/violent: # True: 插件将检测此类别中的消息 # False: 插件将不会检测此类别中的消息 detection: true # 插件在检测到此类别中的消息时执行的操作 actions: warn: # 调整置信度级别以检测此类别中的消息 # 如果更高,插件将仅检测具有高强度危害的消息 # 如果更低,插件将检测低强度危害的消息 # 从 0.0 到 1.0,0.85 是一个好值 confidence: 0.80 # 插件是否将从玩家处隐藏消息 hideMessage: true # 插件在检测到此类别中的消息时执行的命令 # 占位符:%player%:发送消息的玩家 # %player_uuid%:发送消息的玩家的 UUID commands: - "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。" other: confidence: 0.95 hideMessage: true commands: - "kick %player%" # OPENAI self-harm/instructions: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用自我伤害指令。" # OPENAI harassment: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许骚扰其他玩家。" # OPENAI violence/graphic: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用暴力。" # OPENAI illicit: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用不正当语言。" # OPENAI self-harm/intent: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用自我伤害意图。" # OPENAI hate/threatening: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。" # OPENAI sexual/minors: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用性语言。" # OPENAI harassment/threatening: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。" # OPENAI hate: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用仇恨语言。" # OPENAI self-harm: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用自我伤害语言。" # OPENAI 和 MISTRAL sexual: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用性语言。" # OPENAI violence: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。" # MISTRAL # 表达对基于保护特征(如种族、民族、宗教、性别、性取向或残疾)的个人或群体表现出偏见、敌意或倡导歧视的内容。 这包括侮辱性词语、非人化语言、针对特定群体的排斥或伤害呼吁,以及基于这些特征持续骚扰或欺凌个人。 hate_and_discrimination: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用仇恨语言。" # MISTRAL # 描述、美化、煽动或威胁针对个人或群体的身体暴力。 这包括伤病或死亡的生动描述、明确的伤害威胁以及执行暴力行为的说明。 此类别涵盖有针对性的威胁和一般宣扬或美化暴力。 violence_and_threats: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。" # MISTRAL # 推广或提供关于非法活动或可能造成严重身体伤害、死亡或法律后果的极端危险行为的指导。 这包括关于制造武器或爆炸物、鼓励冒险行为、推广非暴力犯罪(如欺诈、盗窃或贩毒)的指导。 dangerous_and_criminal_content: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。" # MISTRAL # 推广、指导、计划或鼓励故意自我伤害、自杀、饮食失调或其他自我破坏行为。 这包括详细的方法、美化、自杀意图声明、危险挑战和相关俚语术语。 selfharm: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用暴力语言。" # MISTRAL # 包含或试图获得详细的或定制的医疗建议的内容 health: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用带有定制的医疗语言。" # MISTRAL # 包含或试图获得详细的或定制的财务建议的内容。 financial: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用财务语言。" # MISTRAL # 包含或试图获得详细的或定制的法律建议的内容。 law: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用带详细语言。" # MISTRAL # 包含或试图获得个人身份信息(如全名、地址、电话号码、社会安全号码或财务账户详细信息)的内容。 pii: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许泄露个人信息。" # DETOXIFY toxicity: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用有毒语言。" # DETOXIFY sexual_explicit: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用性显语言。" # DETOXIFY severe_toxicity: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用严重有毒语言。" # DETOXIFY obscene: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用粗俗语言。" # DETOXIFY threat: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。" # DETOXIFY identity_attack: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用威胁性语言。" # DETOXIFY insult: detection: true actions: warn: confidence: 0.80 hideMessage: true commands: - "SEND_MESSAGE &6%player% &c您不允许使用辱骂性语言。" print-api-errors: false # 为了调试目的,我建议在生产环境中将其设置为 false