FastComments.com Blog

Mon Sep 18 2023
...

スパム検出トレーニングがテナントごとになりました

何が新しいのか

コメントをスパムとしてマークするか、スパムでないとマークすると、FastCommentsはこれを学習して将来のスパム検出に活用します。

しかし、この学習はすべての人のために同じ場所で行われていました。つまり、他のテナントのスパムトレーニングがあなたのものに影響を与えていました。これには良い面と悪い面があります。まず、他のモデレーターがスパムと見なすものから自動的に利益を得ることができます。悪い面は、彼らが間違いを犯した場合や、彼らのコンテンツがあなたのものとは異なる場合です。

たとえば、別のテナントがレーシングシミュレーターに関するオーディエンスを持っている場合、彼らは「暗号スパム」として多くのコメントをスパムとマークしているかもしれません。その結果、分類器は暗号に関連するテキストをスパムとして関連付け始めます。

しかし、あなたのサイトが暗号志向だとしましょう。今、多くのあなたのコメントがスパムとしてマークされ始めていますが、実際にはスパムではありません。それらの中には正当なスパムもあるかもしれませんが、多くはそうではありません。

孤立したトレーニング

新しいテナントがFastCommentsに参加すると、デフォルトでは他のテナントの過去の作業に基づいてスパム検出がトレーニングされます。

コメントをスパム/スパムでないとマークし始めると、システムはあなた自身のトレーニングセットを使用するように移行します。

更新 2023年9月20日

この設定がデフォルトで誰にとっても理想的ではなかったことがわかりました。孤立したスパムトレーニングはオプトインのみではありません。これは、「スパムフィルター」オプションで「孤立」を選択することで、モデレーション設定ページで有効にできます。

デフォルトは再び「共有」トレーニングに戻りました。

ライブ

あなたのテナントのトレーニングセットは、コメントをスパムまたはスパムでないとマークするたびに常に再構築されます。

以前は、システムは定期的にスパムインデックスを再構築していました。これは、過剰な負荷からシステムを保護するために行われていました。数年後、継続的なトレーニングからの負荷がそれほど高くないことがわかったため、システムを更新して、変更を加えるたびにインデックスを自動的に更新するようにしました。

これらのインデックスは、アプリケーションサーバーのエッジに保存されており、すべて独立して更新され、システムを高速で応答性のある状態に保っています。

取得方法

この機能はすべての顧客に展開されました!

結論

すべての主要なリリースと同様に、この機能を最適化、テスト、適切にリリースするための時間を取ることができたことを嬉しく思います。問題を発見した場合は、下にお知らせください。

乾杯!