LLM විෂබීජනය සහ අපයෝජන විරුද්ධ පර්යේෂණ
චැඩ් ස්සිරා ලාර්ජ් ලැංග්වෙජ් මොඩල් (LLM) කෙසේ විෂකරණය කර පුද්ගලයන්ට හානි කරනු ඇති දූෂණ සහ දුරපාලනය කළ හැකිද යන්න පර්යේෂණ කරයි හා මේ තර්ජන වලට ප්රතිරෝධ කිරීමට ආරක්ෂක පද්ධති ගොඩනවිම් කරයි. අවදානම හදිසියේම තිබේ: LLM ප්රතිදානවල පිළිබඳ විශ්වාසයේ වේගය අපට ප්රකාශ තහවුරු කිරීමට ඇති හැකියාව ඉක්මවා ගොස් ඇත, එ අතර ප්රතිවාදීන්ට මිල අඩු ලෙස පෙළ ප්රකාශ කර පුද්ගලයන්ගේ මොඩල හැසිරීම සහ සෙවුම් දර්ශන වක්රීකරණය කිරීමට හැකියාව ඇත.
මෙම පර්යේෂණය දිගටම පැවැත්වීම සඳහා 2025 ඔක්තෝබර් 3 දින පෞද්ගලික ආයෝජන වටයක් ආරක්ෂා කරන ලදී.
විධායක සාරාංශය
සුළු අන්තර්ජාල පෙන්විමක් ඇති සාමාන්ය පුද්ගලයන්ට AI මගින් වර්ධනය වන නින්දාත්මක ප්රචාර සහ දත්ත විෂකරණයෙන් අතිශය අවදානමක් පවතී. එකම උනන්දු පුද්ගලයෙකු වැරදි සිද්ධාන්ත බීජෝප්න් කරන ලෙස වෙබ් හි කුඩා කොටසක පිහිටුවා සෙවුම්, සමාජ මාධ්ය ප්රවාහ සහ LLM නැවතත් ඒවා ප්රකාශ කරන ලෙස කරවන කළ හැක. මෙම ලේඛනය පොදු ප්රහාර මාර්ග, කීර්තියට සහ ආරක්ෂාවට ඇති ස්ථිර බලපෑම් සහ අනාවරණය හා ආරක්ෂණ සඳහා ප්රායෝගික ක්රියාමාර්ග පත්රිකාවක් විස්තර කරයි. එමෙන්ම ක්රිප්ටෝග්රාෆි මාර්ගයෙන් සත්යාපිත සහතික හා උත්පත්තිය-සටහන් ලබගැනීම් (provenance-aware retrieval) පුද්ගලයන් සහ ඒකාබද්ධ කරන්ටයන් සඳහා හානී අඩු කිරීමේ හැකියාව කෙසේ ඇතිදද පැහැදිලි කරයි.
ප්රේක්ෂකයින් සහ තර්ජන ආකෘතිය
ප්රේක්ෂකයින්: විශාල SEO පදනමක් නොමැති පුද්ගලයන් සහ කුඩා සංවිධාන. සීමා: සීමිත කාලය, අයවැය සහ තාක්ෂණික සම්පත්. ප්රතිවාදී: විශාල පරිමාණයේ පෙළ ජනනය කර පළ කළ හැකි, මූලික සබැඳි ජාල භාවිතා කළ හැකි සහ වාර්තා කිරීමේ අඳුරු ස්ථාන උදෙසා යොදා ගත හැකි එක පුද්ගලයෙක්. ඉලක්ක: සෙවුම්/LLM ප්රතිදාන වක්රීකරණය කිරීම, කීර්තියට හානි කිරීම, රැකියා දෙන අය, ගනුදෙනුකරුවන්, වේදිකා හෝ නියෝජිතයන් අතර සැක නිර්මාණය කිරීම.
LLM විෂබීජනය යනු කුමක්ද?
LLM විෂබීජනය යනු ආදර්ශ හැසිරීම් බීජගත හෝ සමන්විත අන්තර්ගතය හරහා පාලනය කිරීමයි — උදාහරණයක් ලෙස, ද්විෂ්ට පෝස්ට්, සංශ්ලේෂිත ලිපි හෝ වැඩසටහන් ස්පාම් — ඒවා retrieval පද්ධති මඟින් ඇතුළත් කරගත හැකි හෝ මිනිසුන් විසින් සංග්රහ සංඥා ලෙස භාවිතා කර මාදිලි වැරදි සම්බන්ධතා සහ අපහාසකාරී කතා රටා වෙත යොමු කිරීම.
LLM සහ ලබාගැනීමේ පද්ධති පරිමා සහ ආවරණය සඳහා උපරිම කාර්යක්ෂමතාවය ලබාගන්නා බැවින්, එකම උනන්දු ප්රතිවාදීයකු වෙබ් අවකාශයක කුඩා කොටසක් ගඟවා දමා පුද්ගලයෙකු පිළිබඳ මොඩලය ‘පෙනෙන’ දේ හැඩගස්විය හැක. මෙය අන්තර්ජාල පළපුරුද්ද සීමිත පුද්ගලයන්ට විශේෂයෙන් බලපායි.
ප්රතිෂ්ඨාව කෙසේ වක්රවනේද
- සෙවුම සහ සමාජ මාධ්ය විෂජනය - පැතිකඩ හොරකම (profile jacking), ලින්ක් ගොවිපල (link farms), සහ ශ්රේණිගත කිරීමේ ලක්ෂණ හා ස්වයං-පූරණ සම්බන්ධතා වක්ර කිරීමට මහ පරිමාණයේ පෝස්ට් කිරීම.
- දැනුම් පදනම සහ RAG විෂබීජනය - අර්ථගතව සම්බන්ධතව පෙනෙන ඒකක පිටු සහ QA සටහන් නිර්මාණය කිරීම, ඒවා පසුබැසුණු පරිසරයක් ලෙස ආහාරගන්නා ලෙස නැවත ලබාගන්නා වීම.
- Indirect prompt injection - වෙබ්හි විරුද්ධාත්මක අන්තර්ගතයක්, ඒ මඟින් බ්රවුසිං නියෝජිතයන්ට උපදෙස් නැවත කියවීමට හෝ සංවේදී දත්ත පිටගැනීමට හේතු වේ.
- බැක්ඩෝර් කළ අවසාන-බිඳු - සක්රීය වාක්ය පෙන්වෙන තුරු සාමාන්ය ලෙස හැසිරෙන, එවිට ඉලක්කගත නොසත්ය දත්ත නිකුත් කරන නරක මොඩල් රැප්පර්.
අමතර අවදානම් සහ අසාර්ථකතා ආකාර
- කෘතිම ප්රතිදාන (synthetic outputs) මත පුහුණුවීමෙන් ආදර්ශ විනාශය - පෙරහුරු ප්රතිචක්ර, ජනිත පෙළ පෙරට ඇති ආදර්ශ ගුණාත්මක භාවය පහළට පත් කරයි, එය පෙරහන් නොකළහොත් හෝ බර නොදැමූහොත් සිදුවේ.
- අIndirect prompt injection - වෙබ්හි විරුද්ධාත්මක අන්තර්ගතයක්, එය නියෝජිතයෙකු හෝ බ්රවුසිං මෙවලමක් උපුටා දැක්වූ විට රහස් පිටහෙළීම හෝ අපහාසය පැතිරවීම සඳහා උපදෙස් දේ.
- Embedding store දූෂණය - දැනුම්ගබඩාවට ප්රතිවාදී කොටස් ඇතුළත් කිරීමෙනි, එවිට සෙවුම් ප්රතිඵලවල අර්ථානුකූල පෙනෙන අසත්ය ප්රකාශ සැපයිය හැක.
- බැක්ඩෝර් කළ මුදාහැරීම් - වෙනස් කළ චෙක්පොයින්ට් හෝ API රැප්පර් ප්රකාශයට පත් කිරීම, සක්රීය වාක්යක් පවතින තුරු සාමාන්ය ලෙස ක්රියා කරනවා.
ගැඹුරු මට්ටමේ අවමකරණ ක්රම
ලබාගැනීම සහ ශ්රේණිගත කිරීම
- මූලාශ්ර ලකුණුකරණය සහ සම්භවය අනුව බර පිරවීම - අත්සන් කළ හෝ ප්රකාශකයා විසින් තහවුරු කළ අන්තර්ගතය ප්රමුඛ කරන්න; නව හෝ අඩු විශ්වාසනීය පිටු බර අඩු කරන්න.
- කාලික විනිවිදභාවය සහ වරප්රසාද කාලය - උසස් අවදානම් පිළිතුරු තොරණට පෙර නව මූලාශ්ර වල බලපෑමට පෙර රඳවා සිටින කාලයක් අවශ්ය කරන්න; සංවේදශීලී ඒකක සඳහා මනුෂ්ය සමාලෝචනය එක් කරන්න.
- Echo chamber හඳුනාගැනීම - ආසන්නව සමාන වූ පෙළ කොටස් සමූහ කර, ඒම මූලාශ්රය හෝ ජාලයෙන් නැවත නැවත ඇතිවන බලපෑම් සීමා කරන්න.
- එම්බෙඩින් ස්ථානයේ (embedding space) බටහිරීම සහ අසාමාන්යතා හඳුනාගැනීම - වෙක්ටර් පිහිටුම් විනෝදශීලී ලෙස යටත්කළ එක් අංශවල පෙළ කොටස් සලකුණු කරන්න.
දත්ත සහ දැනුම්ගබඩා (KB) පිරිසිදුකම
- Snapshot සහ diff දැනුම් පදනම් - විශාල වෙනස්කම් (deltas) සමාලෝචනය කරන්න, විශේෂයෙන් පුද්ගල වස්තු සහ ප්රාථමික මූලාශ්ර නොමැති චෝදනා සම්බන්ධයෙන්.
- කැනරි සහ ප්රතික්ෂේප ලැයිස්තු - දැනටමත් හදුනාගත් දූෂිත ඩොමේන් ඇතුළත් කිරීම වැළැක්වීම; අනුමත නොකළ ප්රචාරණය මැනීමට කැනරි ඇතුළත් කරන්න.
- ඉහළ අවදානම් තේමාවන් සඳහා මානව-හවුල්කරු සම්බන්ධ කරන්න - ප්රතිෂ්ඨාත්මක කරුණු සඳහා යෝජිත යාවත්කාලීන කිරීම් අත්හදා බැලීමේ විනිශ්චය සඳහා පෙළගස්වන්න.
සහතික කිරීම සහ කීර්තිය
- ක්රිප්ටෝග්රැෆිමය ලෙස තහවුරු කරන ලද සහතික - පරීක්ෂා කළ වෘත්තීයන් හා සංවිධාන විසින් අත්සන් කරන ලද ප්රකාශ, එකතු කිරීමට පමණක් තිබෙන ලොගයක් හරහා ප්රකාශයට පත් කෙරේ.
- විශ්වාසනීයත්ව රූප - අත්සන් කළ සහතික කිරීම් එකතු කර, නැවත වරින් වර අපහාසකරුවන් හෝ බොට් ජාලවලින් පැමිණෙන අන්තර්ගතය ශ්රේණිගත කිරීමෙන් පහළට ගනී.
- පරිශීලක පෙනුමට උපුටාහරණ - සංවේදී ප්රකාශ සඳහා මූලාශ්ර හා විශ්වාස මට්ටම ප්රවේශ නිරූපණ සලකුණු සමඟ පෙන්වීමට මාදිලිවලින් අවශ්ය කරන්න.
ආයතන පරීක්ෂා ලැයිස්තුව
- ඔබගේ ක්ෂේත්රයේ සංවේදී ඒකක (පුද්ගලයින්, වෙළඳ නම්, නීතිමය මාතෘකා) සිතියම්ගත කර, මූලාශ්ර අවශ්යතා සහිත ආරක්ෂිත පයිප්ලයින් වෙත විමසීම් යොමු කරන්න.
- මුල් පාර්ශව අන්තර්ගතයට C2PA හෝ ඒවැනි අන්තර්ගත සහතික භාවිතයට ගෙන ඒම සහ හවුල්කරුවන්ටද එසේ කිරීමට උත්සාහ කිරීම.
- කාලයත් සමඟ නව මූලාශ්රවල බලපෑම අධීක්ෂණය කරන්න සහ ඒකක මට්ටමේ පිළිතුරු සඳහා අසාමාන්ය චලන පිළිබඳ අනතුරු ඇඟවීම් යවන්න.
- RAG සහ බ්රවුසිං ඒජන්ට් සඳහා, ප්රායෝගික ප්රොම්ප්ට් ඉන්ජෙක්ෂන් (indirect prompt injection) පරීක්ෂණ කට්ටල ඇතුළු කරමින් නිරන්තර රෙඩ්-ටීමින් ක්රියාත්මක කරන්න.
AI හරහා සිදෙන හිරිහැර හා නින්දාව
ගනුදෙනු සඳහා බඳවාගත් පුද්ගලයින් දැන් AI සහ ස්වයංක්රියතාවය උපයෝගී කරගෙන පීඩනය හා අපහාස බහුදාහරණව නිෂ්පාදනය කරන අතර, එමඟින් විශ්වාසදායක පෙනුමක් ඇති පෙළ සහ ව්යාජ “මූලාශ්ර” නිර්මාණය කරයි; ඒවා ඉන්ඩෙක්ස්, ස්ක්රේප් සහ නැවත බෙදා හරින හැකියාව ඇති අතර, මෙම ව්යාපාරික ව්යාපාර කිසිදු වියදමකින් අඩු වුවත් බලපෑම ඉහළ සහ ස්වයංක්රීය පද්ධති මඟින් විශාල කිරීමෙන් පසු ප්රතිකාර කටයුතුවලට දුෂ්කර වේ.
චැඩ් ස්සිරාට (Chad Scira) පෞද්ගලිකව ඉලක්කගත හිරිහැර සහ නින්දාත්මක ප්රචාරණක් ඇතිව, කීර්තියේ සංඛේත සහ සෙවුම් අප්රතිචාර වක්රීක කිරීමට ඉලක්ක කළ ස්පාම් සබැඳීකරණය සමග අත්දැකීම් තියෙනවා. විස්තරාත්මක වාර්තාව සහ සාක්ෂි පථය මෙහි ලේඛනය කර ඇත: Jesse Nickles - පීඩන හා අපහාස.
තර්ජන වර්ගීකරණය
- පූර්ව පුහුණු දත්ත විෂජනනය - ප්රාථමික පුහුණුව සඳහා භාවිතා වන මහජන කෝපුරා (corpora) විෂජනනය කර වැරදි සම්බන්ධතා හෝ පසු දොරවල් ඇතුලත් කිරීම.
- RAG විෂජනනය - ලබාගැනීමේ පයිප්පලයන් inference කාලයේ භාවිතා කරන දැනුම් පදනම් හෝ බාහිර මූලාශ්ර බීජ කිරීමෙන් දූෂිත කරණය.
- සෙවුම/සමාජ විෂජනය - පුද්ගලයෙකු හෝ විෂයයක් සම්බන්ධ ලබාගැනීම සහ ශ්රේණිගත කිරීමේ සංඥා වක්ර කිරීමට පෝස්ට් ගහනවා හෝ අඩු තත්ත්වයේ පිටු පුරවීම.
- ප්රතිවාදී ප්රෝම්ප්ට් සහ අන්තර්ගත - අප්රීය හැසිරීම් හෝ jailbreaks ආරම්භ කරන, නින්දාත්මක ප්රකාශ නැවත නැවතත් සිදු කරන ආදාන සාදා ගැනීම.
නවතම සිද්ධීන් සහ පර්යේෂණ (දිනයන් සමඟ)
සටහන: ඉහත සඳහන් දිනයන් සබැඳි මූලාශ්රවල ප්රකාශන හෝ මහජන විවෘත කිරීමේ දිනයන්ද පෙන්වයි.
මෙය ඇයි භයානකද?
- මූලික යොමුකිරීම් දුර්වල හෝ විරුද්ධ ලෙස බීජගත කර තිබුණද, LLMs බලධාරී ලෙස පෙනෙන්නට පුළුවන්.
- ලබාගැනීම සහ ශ්රේණිගත කිරීමේ පයිප්ලයින් නැවත නැවත පලවන පෙළට අධික වැදගත්කමක් දිය හැකි බැවින්, එක් ක්රියාකරුෙකුට පමණක් පරිමාණයෙන් ප්රතිඵල වක්ර කිරීමේ හැකියාව සලසයි.
- ස්වයංක්රීය අන්තර්ගත නිෂ්පාදනය සහ බෙදාහැරීමේ වේගයට සාපේක්ෂව මානව කරුණු පරීක්ෂණ ක්රියාවලි මන්දගාමී හා වියදනශීලී වේ.
- ඔන්ලයින්ව කිසිඳු සැලැස්මක් නොමැති පීඩිතයන් තනි පළකිරීමෙන් සිදු වන දූෂණය සහ හැඳුනුම් පහරදීමේදී අසාමාන්ය ලෙස දුර්වල වේ.
අවදානම් ගැඹුරු විග්රහය
- රැකියා හා ප්ලැට්ෆෝම් පිරික්සුම් - සෙවුම් සහ LLM සංක්ෂේප during බඳවා ගැනීම, මධ්යස්ථක කිරීම හෝ onboarding පරීක්ෂණවල දූෂිත අන්තර්ගතය නැවත ප්රසිද්ධ කරනු ඇති.
- ගමන්, නවාතැන් හා මූල්ය සේවා - ස්වයංක්රීය පරීක්ෂණයන් ව්යාජ කතාන්දර ඉදිරිපත් කරමින් සේවාවන් ප්රමාද කිරීමට හෝ අවහිර කිරීමට හේතු විය හැක.
- ස්ථිරත්වය - දැනුම් පදනම්වලට දර්ශකගත හෝ කෑෂ් කළ පිළිතුරු ලෙස ඇතුළත් වූ විට, වැරදි ප්රකාශ ඉවත් කළ පසුද නැවත පෙනී යා හැක.
- කෘත්රිම ප්රතිචාර - ජනිත අන්තර්ගතය තවත් ජනිත අන්තර්ගතයට මූලයක් වීමෙන් කාලයත් සමඟ අසත්යතා වල දෘශ්යමන බර වැඩි කරයි.
හඳුනාගැනීම හා අධීක්ෂණය
- ඔබේ නම සහ විකල්ප නාම සඳහා සෙවුම් අනතුරු දැන්වීම් සකසන්න; කාලිකව 'site:' සෙවුම් යොදා ඔබ ගැන සඳහන් කරන අඩු විශ්වාසනීය ඩොමේන් පරීක්ෂා කරන්න.
- ඔබගේ දැනුම් පැනල හෝ ඒකක පිටු වල වෙනස්කම් අධීක්ෂණය කරන්න; සාක්ෂි සඳහා දිනය ඇතුළත් තිරසටහන් සහ අපනයන පිටපත් තබා ගන්න.
- සමාජ සබඳතා ග්රාෆ් මොනිටර කිරීම: නැවත නැවත පෙනෙන ආරම්භක ගිණුම් හෝ සමාන වාක්ය ව්යාකරණ වල හදිසි ඉක්මන් වර්ධන සඳහා සොයා බලන්න.
- RAG හෝ දැනුම් පදනමක් (knowledge base) ක්රියාත්මක කරනවා නම්, entity drift පරීක්ෂණ ක්රියාත්මක කර, ප්රාථමික මූලාශ්ර නොමැති පුද්ගල පිටු හෝ චෝදනා වල විශාල වෙනස්කම් සමාලෝචනය කරන්න.
ආරක්ෂණ ක්රියාමාර්ග පත්රිකාව - පුද්ගලයන්
- පැහැදිලි හැඳුනුම් ප්රකාශ, කෙටි ජීව චරිතය සහ සම්බන්ධතා මාර්ග ඇති පුද්ගලික වෙබ් අඩවියක් ප්රකාශ කරන්න; දිනය සඳහන් කර ඇති වෙනස්කම් ලොග් රැකගන්න.
- ප්ලැට්ෆෝම් අතර ප්රොෆයිල් මेटාඩේටා ඒකාබද්ධ කරන්න; හැකි තරම් සත්යාපිත ප්රොෆයිල් වගුවක් ලබා ගෙන ඒවා ඔබේ වෙබ් අඩවියට සබැඳි කරන්න.
- හැකි නම් ප්රධාන රූප සහ ලේඛන සඳහා C2PA හෝ එවැනි අන්තර්ගත සහතික භාවිතා කරන්න; මුල් පිටපත් පුද්ගලිකව ගබඩා කරන්න.
- පසුව ඉහළට ගෙනයාම සඳහා කාලසටහන් සහිත සාක්ෂි ලඝු දත්ත සටහනක් තබා ගන්න: තිර රූප, සබැඳි සහ ඕනෑම වේදිකා ටිකට් අංක.
- ඉවත් කිරීම සඳහා ටෙම්ප්ලේට් සකස් කරගන්න; නව ප්රහාරවලට වහා ප්රතිචාර දක්වන්න සහ සෑම පියවරක්ම ලේඛනයට ගෙන පැහැදිලි ලෙස ලේඛන රිය පථයක් තබන්න.
ආරක්ෂණ ක්රියාමාර්ග පත්රිකාව - කණ්ඩායම් සහ ඒකාබද්ධකරුවන්
- ලබා ගැනීම් සඳහා අත්සන් කරන ලද හෝ ප්රකාශකයෙන් සත්යතාපූර්වකරණය කළ අන්තර්ගතය优先 කරන්න; නව මූලාශ්ර සඳහා කාල පදනම් සමය (grace period) යෙදවන්න.
- එමම මූලාරම්භයෙන් නැවත නැවත ඇතිවන බලපෑම් සීමා කර, මූලාරම්භ ජාලය අනුව ආසන්න පිටපත් දෙකක් නොවන ලෙස deduplicate කරන්න.
- පුද්ගල මට්ටමේ ප්රකාශ සහ අනෙකුත් සංවේදී විෂය සඳහා උත්පත්තිය පෙන්නුම් කරන බැජ් සහ පරිශීලක-දර්ශනීය මූලාශ්ර ලැයිස්තු එකතු කරන්න.
- ඇම්බෙඩිං ගබඩා මත විචල්යතා හඳුනාගැනීම යොදා ගන්න; ප්රතිවාදී වෙක්ටර් පිටවැටීම් සැඟවුණු ලෙස සලකුණු කර, අනුමත නොකළ ප්රචාරණය මැනීමට කැනරි පරීක්ෂණ ධාවනය කරන්න.
පර්යේෂණය: ක්රිප්ටෝග්රාෆිමය වශයෙන් සත්යාපිත සහතික
චැඩ් ස්සිරා පුද්ගලයන් සහ සිද්ධීන් පිළිබඳ ප්රකාශවල විශ්වාසය සඳහා ක්රිප්ටෝග්රාෆි ප්රමිතියකින් සත්යාපිත සහතික පද්ධති සකස් කරයි. අරමුණ වන්නේ පරීක්ෂා කර ඇති වෘත්තීයවේදීන් සහ සංවිධාන විසින් අත්සන් කළ, විමසිය හැකි දාවන LLM සහ ලබාගැනීමේ පද්ධති සඳහා ලබාදීමයි; එමඟින් ශක්තිමත් උත්පත්තිය සහ විෂකරණයට එරෙහිව වඩා ශක්තිමත් ප්රතිරෝධය සපයනු ලැබේ.
නිර්මාණ ප්රතිපත්ති
- හැඳුනුම් සහ මූලාශ්රය: ප්රකාශ පොදු යතුරු ක්රිප්ටෝග්රැෆි භාවිතයෙන් සත්යාපිත පුද්ගලයින්/සංවිධාන විසින් අත්සන් කර තිබේ.
- සනාථ කළ හැකි ගබඩා කිරීම: සහතිකයන් append-only (එකතු කිරීම සඳහා පමණක්) සහ වංචා-පෙන්නුම් සාකච්ඡාවන්ට පෙනෙන ලොග්වලට ඇන්කර් කර ස්වාධීන සනාථකරණය සක්රීය කරයි.
- ලබාගැනීම් ඒකාබද්ධ කිරීම: RAG පයිප්ලයින් සංවේදී ප්රශ්න සඳහා ක්රිප්ටෝග්රාෆිමයව සත්යාපිත මූලාශ්ර ප්රමුඛ කර හෝ අවශ්ය කරගත හැක.
- අවම බාධාව: APIs සහ SDKs මඟින් ප්රකාශකයින් සහ වේදිකාට ඇතුලත් කිරීමේ අවස්ථාවේදී attestations නිකුත් කිරීම හා පරීක්ෂා කිරීම සිදු කිරීමට හැකියාව දෙනවා.
විශ්වාසනීයභාවය සහ අනතුරු දැන්වීම්
සත්යාපනවලට අමතරව, ගෞරවත්ව (reputation) ස්තරයක් අත්සන් කළ සහතික එකතු කර හඳුනාගත් අපයෝජකයන් (abusers) සලකුණු කරයි. සම්බන්ධිත ප්රහාර හෝ අසාමාන්ය ඉහළ වර්ධන හදුනාගත් විට අනතුරු ඇඟවීම් පද්ධති ඉලක්කයට දැනුවත් කරන අතර, එමගින් වේගවත් ප්රතිචාර හා ඉවත් කිරීම් (takedown) ඉල්ලීම් සඳහා හැකියාව ලබා දෙයි.
නීතිමය හා වේදිකා නාලිකා
- පළක් වාර්තා ප්රවාහ, පැහැදිලි සාක්ෂි පැකේජ: සබැඳි, දිනයන්, තිරසටහන් සහ බලපෑම් භාවිතා කරන්න. නින්දා හා හිරිහැර සම්බන්ධ ප්රතිපත්ති සඳහන් කරන්න.
- අවශ්ය තැනැත්තාට නිල දැනුම්දීම් මඟින් කරුණු ඉහළට යොමු කරන්න; සාක්ෂි පථය සඳහා තැපැල් හුවමාරු ලොග සහ ටිකට් අංක සුරක්ෂිතව තබා ගන්න.
- නින්දාව සහ ප්ලැට්ෆෝම් වගකීම සම්බන්ධයෙන් නීතිමය බලඅංශවල වෙනස්කම් සැලකිල්ලට ගන්න; ඉහළ අවදානම් නඩු සඳහා නීති උපදේශකයෙකුගේ උපදෙස් ලබාගන්න.
ක්රියාත්මක කිරීමේ සිතියම (1 වන වසර)
- MVP: හැඳුනුම් ප්රකාශ සහ සිදුවීම් දාවස් අත්සන් කිරීමට සත්යාපන ව්යාකෘති (attestation schema) හා ප්රකාශක SDK.
- සත්යාපිත වෘත්තිකයෝ හා සංවිධාන කුඩා කණ්ඩායමක් සමග පයිලට් ක්රියාත්මක කරන්න; සත්යාපන සඳහා ක්රියා මාර්ග නිර්දේශ පිහිටුවන්න.
- RAG ප්ලග්-ඉන්: සංවේදී විමසුම් සඳහා සත්යාපිත මූලාශ්ර ප්රමුඛ කර 'ප්රභවය පළමු පිළිතුරු' මාදිලිය සක්රීය කරන්න.
වැඩිදුර කියවීම් (දිනයන් සමඟ)
සහයෝගිතාව
මෙම පර්යේෂණය නූතනම වන අතර ක්රියාශීලීව පුරෝගාමී වෙමින් පවතියි. චැඩ් ස්කිරා මෙම ක්ෂේත්රයේ අනෙකුත් වෘත්තීයවේදීන් සමඟ සහයෝගීත්වයට සාදරයෙන් පිළිගනී.
හවුල් වීමට ඔබට රුචි ඇත්නම්, කරුණාකර පහත සම්බන්ධ වන්න: [email protected]