การวิจัยเรื่องการปนเปื้อนของ LLM และการป้องกันการละเมิด

Chad Scira ຄົ້ນຄວ້າວິທີທີ່ແບບພາສາໃຫຍ່ (large language models) ສາມາດຖືກປ່ອຍຂໍ້ມູນທີ່ເປັນພາຍທີ່ ແລະ ຖືກນໍາໃຊ້ເພື່ອເສຍຫຼຸດຕໍ່ບຸກຄົນ, ແລະສ້າງລະບົບປົກປ້ອງເພື່ອຕໍ່ສູ້ເຮືອນເຫມື່ອນ. ຄວາມເສຽງແມ່ນດ່ວນ: ຄວາມໄວ້ໃຈໃນຜົນລັບຂອງ LLM ໄດ້ເກີນຄວາມສາມາດຂອງພວກເຮົາໃນການກວດສອບຂໍ້ຄວາມ, ໃນຂະນະທີ່ຜູ້ປ່ອຍຂໍ້ມູນສາມາດຖືກຜະລິດໄດ້ຄ່າຖືກແລະງ່າຍດາຍທີ່ຈະປ່ຽນພຶດຕິກຳຂອງແບບມອດ ແລະ ການນຳໃຊ້ໃນການຄົ້ນຫາ ສຳລັບບຸກຄົນທີ່ບໍ່ມີຮູບພາບອອນໄລນ໌ກວ່າ.

ການຮັບທຶນສ່ວນຕົວໄດ້ຖືກປະກັນໃນວັນທີ 3 ເດືອນຕຸລາ 2025 ເພື່ອສື່ມຕໍ່ການຄົ້ນຄວ້ານີ້.

សេចក្តីសង្ខេបប្រធាន

ຄົນທົ່ວໄປທີ່ມີຮັບຮອງອອນໄລນ໌ນ້ອຍເຜີຍພາຍເຜິຍຄວາມສ່ຽງສູງຈາກການເພີ່ມພະລັງຂອງ AI ຕໍ່ການຫມິນເສຍຊື່ ແລະ ການເປັນສາເຫດຂໍ້ມູນ (data poisoning). ຜູ້ດຽວທີ່ມີແນວຄວາມຫມັ້ນຮ້ານສາມາດພັດທະນາເນື້ອຫາທີ່ເປັນເທັກນິກເພື່ອປ່ອຍເຂົ້າໃນສ່ວນນ້ອຍຂອງເວັບ ແລະກຳນົດສິ່ງທີ່ແມ່ນເຫັນໃນແບບຂອງແມ່ນໂມເດວ. ອະໄຫຼ່ນີ້ອະທິບາຍທາງທົ່ວໄປຂອງທາງເຂົ້າແບບຈິງ, ຜົນທີ່ຈິງແກ່ຊື່ແລະຄວາມປອດໄພ, ແລະສໍາລັບການກວດສອບແລະການປ້ອງກັນ. ມັນຍັງອະທິບາຍວ່າວິທີທີ່ໃບຢືນຢັນທີ່ຢືນຢັນດ້ວຍລະບົບຄຣິບໂກຣາຟີ ແລະ ການຄົ້ນຄວ້າທີ່ໃຫ້ຄວາມສຳຄັນກັບຕົ້ນຕົວ (provenance-aware retrieval) ສາມາດຊ່ວຍຫຸ້ມຜົນເສຍ.

ຜູ້ເບິ່ງ ແລະ ໂມເດວຂອງອັນຕະລາຍ

ຜູ້ເບິ່ງ: ບຸກຄົນ ແລະ ອົງກອນຂະໜາດນ້ອຍທີ່ບໍ່ມີການປະຈຳຕົວໃນ SEO ຢ່າງຫຼາຍ. ຂໍ້ຈຳກັດ: ເວລາ, ງົບປະມານ ແລະ ແຫຼ່ງທຶນທາງເຕັກນິກທີ່ຈຳກັດ. ຝ່າຍຄ້າຍ: ຜູ້ດຽວທີ່ສາມາດສ້າງລະຫັດຂໍ້ຄວາມຈຳນວນຫຼາຍ, ໃຊ້ເຄື່ອງມືການເຊື່ອມຕໍ່ພື້ນຖານງ່າຍ ແລະເຂົ້າໃຊ້ຊ່ອງວ່າງໃນການລາຍງານ. ເປົ້າໝາຍ: ການກະແທນຜົນການຄົ້ນຫາ/ຜົນລັບ LLM, ກໍ່ຄວາມເສຍຊື່, ສ້າງຄວາມສັງໄສຕໍ່ນາຍຈັດຈໍາ, ລູກຄ້າ, ແພດຟອມ ຫຼື ຕົວແທນ.

ການ 'LLM poisoning' ແມ່ນຫຍັງ?

การปนเปื้อนของ LLM หมายถึงการจัดการพฤติกรรมของโมเดลผ่านเนื้อหาที่ถูกฝังหรือประสานงานไว้ — เช่น โพสต์มุ่งร้าย บทความสังเคราะห์ หรือสแปมในฟอรัม — ซึ่งอาจถูกนำเข้าโดยระบบดึงข้อมูลหรือถูกใช้โดยมนุษย์เป็นสัญญาณ กระตุ้นให้โมเดลเชื่อมโยงผิดและสร้างเรื่องเล่าหมิ่นประมาท.

ເນື່ອງຈາກ LLM ແລະ ລະບົບການດຶງຂໍ້ມູນເຮັດວຽກເພື່ອຂະໜາດແລະການຄຸດຄອງ, ຜູ້ດຽວທີ່ມີແນວຄວາມຫມັ້ນໃຈສາມາດກຳນົດວ່າແມ່ນອະໄຫຼ່ທີ່ແບບຈິງຈະເຫັນກ່ຽວກັບບຸກຄົນໂດຍການທະນາມເນື້ອຫາເຂົ້າໃນສ່ວນນ້ອຍຂອງເວັບ. ສິ່ງນີ້ມີປະສິດທິພາບສູງຕໍ່ບຸກຄົນທີ່ມີການປະຈຳອອນໄລນ໌ນ້ອຍ.

ແນວທາງ​ដែលຊື່ສຽງ​ត្រូវបានបម្លែង

  • ການການຄົ້ນແລະການປະຊາສັງຄົມທີ່ຖືກປ່ອຍຜິດ - ການຂົນ້າຍໂປຣໄຟລ໌ (profile jacking), ຟາມລິ້ງ (link farms), ແລະ ການໂພສຈຳນວນຫຼາຍເພື່ອກະທຳໃຫ້ການຈັດອັນດັບແລະຄລິກແຕ່ອັດຕະໂນມັດເປັນໄປຢ່າງເໝາະສົມ
  • ការប៉ុលមូលដ្ឋានចំណេះដឹង និង RAG - ការបង្កើតទំព័រអត្តសញ្ញາវត្ថុ និងកំណត់ចំណាំ QA ដែលមើលទៅមានសេម៉ាន្តិចពាក់ព័ន្ធ ហើយត្រូវបានយកអនុវត្តជាបរិបទ។
  • Indirect prompt injection - ມາດຕະການບ່ອນເວັບທີ່ເຮັດໃຫ້ຜູ້ແທນຫຼືឧបករណ៍ບັນທຶກການລະເທີບຄຳສັ່ງຫຼືດຶງຂໍ້ມູນເສັ້ນສັນທ່າງອອກ។
  • Endpoints ທີ່ຖືກເຂົ້າແກ້ (backdoored endpoints) - ການຫໍກອບແບບມອດທີ່ດຳເນີນງານປົກກະຕິຈົນກ່ອນມີຄໍາທີ່ເປັນເຄື່ອງກະທົບ (trigger phrases), ສ່ວນຫນຶ່ງຈະປ່ອຍຂໍ້ຄວາມທີ່ເປັນແພງເປົ່າເປົາ.

ຄວາມສຽງເພີ່ມເຕີມ ແລະ ໂຕແບບການລ່ວງລົ້ມ

  • การล่มสลายของโมเดลจากการฝึกด้วยผลลัพธ์สังเคราะห์ — วงจรป้อนกลับที่ข้อความที่สร้างขึ้นจะทำลายคุณภาพของโมเดลในอนาคตหากไม่ได้รับการกรองหรือปรับน้ำหนัก.
  • Indirect prompt injection - ມາດຕະການប្រឆាំងលើເວັບທີ່ເອົາໃຈນໍາໃຊ້ຜູ້ແທນ ຫຼືឧប​ករណ៍ພົບເບິ່ງໃຫ້ດຶງຂໍ້ມູນសຳລັບຫຼືແຜ່ການបំពានកិត្តិយសເມື່ອຖືກອ້າງອີງ।
  • ការបំពុលហាង embedding - បញ្ចូលផ្នែកអត្ថបទប្រឆាំងក្នុងមូលដ្ឋានចំណេះដឹង ដើម្បីឱ្យការយកតំបន់ឆ្លើយតបបង្ហាញអះអាងមិនពិតដែលមើលទៅសមស្របពីមន័យ។
  • Backdoored releases - ການຜະລິດສິນຄ້າຫຼືການປ່ອຍຊອບແວທີ່ຖືກແກ້ໄຂ (ເຊັ່ນ checkpoints ຫຼື API wrappers) ທີ່ເຮັດວຽກປົກກະຕິຈົນກ່ອນມີຄໍາກະທົບ.

ກໍລະນີຈັງຈິງ ແລະ ການອ້າງອີງ

มาตรการบรรเทาเชิงลึก

ການຄົ້ນຄວ້າແລະການຈັດອັນດັບ

  • ການຄະແນນແຫຼ່ງຂໍ້ມູນ ແລະ ການຫຼຸດ/ເນັ້ນນໍາໜ້າຕາມຕົ້ນຕາຂອງແຫຼ່ງ - ສົງໃຈໃນເນື້ອຫາທີ່ໄດ້ລົງຊື່ ຫຼື ແຜກພິມທີ່ໄດ້ຢືນຢັນ; ຫຼຸດນໍາໜ້າເນື້ອຫາໃໝ່ທີ່ຖືກສ້າງ ຫຼື ໜ້າທີ່ມີຊື່ສຽງຕໍ່າ
  • ການຫລຸດຄ່າເວລາມີຊ່ວງອະນຸໂຍດ (grace period) - ຕ້ອງການໄລຍະເວລາກ່ອນທີ່ແຫຼ່ງໃໝ່ຈະມີຜົນກະທົບຕໍ່ຄຳຕອບທີ່ສຳຄັນ; ເພີ່ມການກວດສອບດ້ວຍມະນຸດສໍາລັບໜ່ວຍທີ່ແກ້ງແວ່ງຫຼາຍ (sensitive entities).
  • ការរកឃើញបន្ទប់ Echo - ចាប់ក្រុមអត្ថបទដែលស្ទើរតែដូចគ្នា ហើយដាក់កំណត់ការប៉ះពាល់ដែលមានការពង្រីកពីប្រភពឬបណ្តាញដដែលឲ្យឡើងវិញ។
  • ການກວດສອບຄຳຜິດແລະຄວາມແປກໃນພື້ນທີ່ embedding - ເກັດໝາຍບົດຄຳທີ່ມີຕຳແໜ່ງເວັກເຕີທີ່ຖືກປັບແຕ່ງໃນທາງການຕໍ່ຕ້ານ.

ការអនាម័យទិន្នន័យ និងមូលដ្ឋានចំណេះដឹង

  • ຖ່າຫຼັກ snapshot ແລະ ฺdiff ຂອງຖານຄວາມຮູ້ - ກວດພິຈາລະນາຄວາມຕ່າງຂ້າງໃຫຍ່, ໂດຍສະເພາະສໍາລັບນິຍົມບຸກຄົນ ແລະ ຂໍ້ຫມາຍຖືກກ່າວຫາທີ່ບໍ່ມີແຫຼ່ງຂໍ້ມູນຕົ້ນຕໍ່າ
  • ລາຍການ canary ແລະ ລາຍການປະຕິເສດ - ປ້ອງກັນການນຳເຂົ້າໂດເມນທີ່ຮູ້ວ່າເປັນການລະບົບທີ່ກ້າວລູກ; ແຊ່ງແຄນາຣີເພື່ອວັດການແຜ່ໂຄງການທີ່ບໍ່ໄດ້ຮັບອະນຸຍາດ.
  • ມະນຸດໃນວົງຜົນສໍາລັບប្រធានបទហានិភ័យខ្ពស់ - ຊຸດການອាប់ដេតដែលបានស្នើសុំពុំក្នុងជួររៀបចំសម្រាប់ការវិនិច្ឆ័យដោយដៃ។

ການຢືນຢັນ ແລະ ຊື່ສຽງ

  • ការបញ្ជាក់ដែលបានផ្ទៀងផ្ទាត់ដោយគ្រីបតូ - សេចក្តីថ្លែងការណ៍ដែលចុះហត្ថលេខាដោយអ្នកជំនាញ និងអង្គការដែលបានពិនិត្យ ហើយបោះពុម្ពផ្សាយតាមកំណត់ត្រាដែលអាចបន្ថែមបានតែប៉ុណ្ណោះ។
  • ແຜນພາບຊື່ສຽງ - ຮວບຮວມການຮັບຮອງທີ່ໄດ້ລົງຊື່ ແລະ ຫັດອັນດັບເນື້ອຫາທີ່ມາຈາກຜູ້ລະເມືອດຊ້ຳ ຫຼື ເຄືອຂ່າຍບອດ
  • ການອ້າງອີງທີ່ເຫັນໄດ້ໂດຍຜູ້ໃຊ້ - ຕ້ອງການໃຫ້ໂມເດລແສງແຫຼ່ງໂຂງຂໍ້ມູນແລະລະດັບຄວາມໝັ້ນໃຈ ພ້ອມດ້ວຍແກັດຂໍ້ມູນກ່ຽວກັບທີ່ມາ (provenance) ສໍາລັບຂໍ້ອ້າງທີ່ສັບສົນ.

បញ្ជីត្រួតពិនិត្យសហគ្រាស

  • ทำแผนที่หน่วยงานที่อ่อนไหวในโดเมนของคุณ (บุคคล แบรนด์ หัวข้อทางกฎหมาย) และนำคำค้นหาไปยังกระบวนการที่ได้รับการป้องกันซึ่งมีข้อกำหนดเกี่ยวกับแหล่งที่มา.
  • ນຳ C2PA ຫຼື ເຄື່ອງມືທີ່ຄ້າຍກັນມາໃຊ້ສໍາລັບເນື້ອຫາຂອງຝ່າຍທຳອິດ ແລະເຊີນຊວນພາກພິເສດໃຫ້ດໍາເນີນເຊັ່ນນັ້ນ.
  • ຕິດຕາມອິດທິພິບາດຂອງແຫຼ່ງໃໝ່ຕາມເວລາ ແລະແຈ້ງເຕືອນເມື່ອມີການເຄື່ອນໄຫວທີ່ບໍ່ວິທີປົກກະຕິສຳລັບການຕອບລະດັບອົງຄົງ.
  • ດໍາເນີນການທົດສອບທີມແດງ (red teaming) ເປັນປີເປັນໄປ ສໍາລັບ RAG ແລະໂປຣແກຣມທີ່ເບິ່ງ ລວມທັງຊຸດການທົດສອບການສົ່ງຄໍາສັ່ງໃຫ້ເປັນອ້າງອີງຢ່າງທຳມະດາ (indirect prompt injection)

ການບຸ່ກຫຼຸກ ແລະ defamation ຜ່ານ AI

ບຸກຄົນທີ່ຖືກជួលໃຊ້ឥະຫນາມໃນດຽວນີ້ນໍາ AI ແລະອັດໂມຕິເຄື່ອງມາໃຊ້ເພື່ອផលິດງານບຸ່ກຫຼຸກ ແລະ defamation ໃນດັດຈຳ, ສ້າງអត្ថបទដែលមើលទៅນ່າជឿ ແລະ "sources" ក្លែងបន្លំ​ដែលងាយក្នុងការបញ្ជី ទាញទិន្នន័យ និងចែកចាយឡើងវិញ។ យុទ្ធនាការទាំងនេះមានចំណាយទាបមានឥទ្ធិពលខ្លាំង ហើយពិបាកដោះស្រាយពេលដែលវាត្រូវបានពង្រីកដោយប្រព័ន្ធស្វ័យប្រវត្តិ។

Chad Scira ໄດ້ປະສົບກັບການກຳກັບແບບເປົ່າເປົາ ແລະ ການຫມິນເສຍຊື່ ຄວ່າມພ້ອມກັບການເຊື່ອມທາງ spam ເພື່ອປັບປຸງສັນຍາລັກຊື່ແລະພົບຜົນໃນການຄົ້ນຫາ. ບົດລາຍລະອຽດ ແລະ ເອກະສານຢືນຢັນຖືກບັນທຶກຢູ່ທີ່ນີ້: Jesse Nickles - ການບຸ່ກຫຼຸກ ແລະ defamation.

ການຈັດປະເພດພາຍຄວາມສຽງ

  • Pretraining data poisoning - ການປ່ອຍພິສາດໃນກຸ່ມຂໍ້ມູນສາທາລະນະທີ່ໃຊ້ໃນການຝຶກອະນຸຕໍ່ຕົ້ນ ເພື່ອປ່ົນຂໍ້ມູນໃຫ້ເກັບການເຊື່ອມຕໍ່ທີ່ບໍ່ຖືກຕ້ອງ ຫຼືແບັກດອອກ (backdoor).
  • RAG poisoning - ການເປັນແຫຼ່ງພິສາດໃສ່ຖານຂໍ້ມູນຄວາມຮູ້ ຫຼືແຫຼ່ງພາຍນອກທີ່ທ່ວມຖາມດຶງເອົາໃຊ້ໃນເວລາການພິຈາລະນາ (inference).
  • ການຄົ້ນ/ສັງຄົມທີ່ຖືກປຽກ - ການທົນລະນ້ຳໂພສຫຼືໜ້າທີ່ທີ່ມີຄຸນນະພາບຕໍ່າເພື່ອກະທຳໃຫ້ສັນຍານການຄົ້ນແລະການຈັດອັນດັບຖ້າກ່ຽວກັບບຸກຄົນ ຫຼື ຫົວຂໍ້
  • ຂໍ້ປ້ອນແບບຕໍ່ຕ້ານແລະເນື້ອຫາທີ່ຈະເຮັດໃຫ້ເກີດພຶດຕິກຳທີ່ບໍ່ຕ້າງຕໍ່ຄວາມຕ້ອງການ ຫຼື jailbreak ທີ່ຊ້ຳຂໍ້ອ້າງຫົວຫົວ.

ເຫດການ ແລະ ການຄົ້ນຄວ້າລ່າສຸດ (ມີວັນທີ)

หมายเหตุ: วันที่ข้างต้นสะท้อนวันที่ตีพิมพ์หรือวันที่เผยแพร่สาธารณะตามแหล่งที่เชื่อมโยง.

ເປັນຫຍັງທີ່ນີ້ເປັນອັນຕະລາຍ

  • LLM อาจดูน่าเชื่อถือแม้แหล่งอ้างอิงพื้นฐานจะอ่อนหรือถูกฝังโดยฝ่ายตรงข้าม.
  • ແຖວການສະຫນອງການຄົ້ນແລະຈັດອັນດັບອາດຈະໃຫ້ນໍານ້ຳຕົວອັກສອນທີ່ຖືກຊ້ຳຫຼາຍ, ເຮັດໃຫ້ຜູ້ຄົນໜຶ່ງສາມາດກະທຳໃຫ້ຜົນລົງໂປ້ແປກໂດຍພຽງຈຳນວນ
  • ការត្រួតពិនិត្យข้อเท็จจริงដោយមនុស្សមានល្បឿនយឺត និងមានចំណាយខ្ពស់ ប្រៀបធៀបនឹងល្បឿននៃការផលិត និងចែកចាយមាតិកាដោយស្វ័យប្រវត្តិ។
  • ເຈົ້າໜ້າທີ່ທີ່ບໍ່ມີການປະກົດຕົວໃນອອນໄລນ໌ເປັນຈິງ ມັກຈະເປັນຜູ້ອ່ຽງໂບດຕໍ່ການເປີດໂພສດ່ຽວດ້ວຍຂໍ້ມູນທີ່ຖືກປ່ຽນແປງ (single post poisoning) ແລະການຮ້າຍຕໍ່ຢັງອະຈະມິດຕົນຕົນ (identity attacks).

ການລຶບລະອຽດຄວາມສ່ຽງ

  • ការត្រួតពិនិត្យការជ្រើសរើសការងារ និងវេទិកា - ការស្វែងរក និងសង្ខេបដោយដំណើរការ LLM អាចស្ទេរecho មាតិកាដែលបានបំពុលក្នុងដំណើរការជ្រើសរើស, ការគ្រប់គ្រង ឬការត្រួតពិនិត្យការចាប់ផ្តើមការងារ។
  • ການທ່ອງເດີນ, ການທີ່ອາໄສ, ແລະບໍລິການທາງການເງິນ - ການກວດອັດໂນມັດອາດຈະເຜີຍເນື້ອຫາທີ່ບໍ່ຖືກຕ້ອງ ທີ່ສາມາດຊ່ວຍຊ້າຫຼືບໍ່ອະນຸຍາດການບໍລິການ.
  • Persistence - ເມື່ອຖືກດັດເຂົ້າໃນຖານຂໍ້ມູນຄວາມຮູ້ ຫຼືຄຳຕອບທີ່ຖືກເກັບໄວ້, ຄຳອ້າງທີ່ບໍ່ຖືກສາມາດປະກົດຂຶ້ນອີກໄດ້ຫຼັງຈາກການລົບອອກ.
  • ຄຳຕິຕິຊົມທີ່ສ້າງຂຶ້ນ - ເນື້ອຫາທີ່ຜະລິດສາມາດເປັນຕົ້ນທີ່ຊ່ວຍໃຫ້ເນື້ອຫາທີ່ຜະລິດຕິດຕໍ່ໄດ້, ເຮັດໃຫ້ນ້ຳໜັກຂອງຂໍ້ຜິດພາດເບິ່ງມີນ້ຳໜັກຫຼາຍຂຶ້ນຕາມເວລາ.

ការរកឃើញ និងការតាមដាន

  • ຕັ້ງການແຈ້ງຄົ້ນຫາສຳລັບຊື່ຂອງທ່ານແລະນາມແທັກ; ກວດເຊັກຄໍາຖາມ site: ເປັນເທື່ອຢ່າງສົດເພື່ອສອບຫາໂດເມນທີ່ມີຊື່ສຽງຕໍ່າທີ່ກ່າຍກ່າຍກ່ຽວກັບທ່ານ
  • ຕິດຕາມການປ່ຽນແປງໃນແຜ່ນຄວາມຮູ້ຫຼືໜ້າໂຕຕົວ; ເກັບຮູບຈໍທີ່ມີວັນທີແລະສ່ງສຳເນົາເປັນເອົາຫຍັງເພື່ອເປັນພຶດສະຫຼຸບ.
  • ตรวจสอบกราฟเครือข่ายสังคมสำหรับบัญชีต้นทางที่ปรากฏซ้ำหรือการพุ่งขึ้นอย่างฉับพลันของสำนวนที่คล้ายกัน.
  • ຖ້າກໍາລັງប្រតិបត្តິ RAG ຫຼືមូលដ្ឋានចំណេះដឹង សូមធ្វើការត្រួតពិនិត្យ entity drift ແລະពិនិត្យការផ្លាស់ប្ដូរធំៗចំពោះទំព័របុគ្គល ឬការចោទប្រកាន់ដែលគ្មានប្រភពដើម។

ຄູ່ມືການປົງກັນ - ບຸກຄົນ

  • ຕົກລົງຜົນແຜ່ເວັບໄຊສ່ວນຕົວທີ່ມີການຢືນຢັນຕົວຕົນຢ່າງຊັດເຈນ, ສັ້ນໆເກັບບິອະ, ແລະວິທີຕິດຕໍ່; ຮັກສາບັນທຶກການແກ້ໄຂທີ່ມີວັນທີ.
  • ຈັດໃຫ້ແທດຂໍ້ມູນໂປຣໄຟລ໌ (metadata) ສະຫມັດກັນທົ່ວແພດຟອມ; ໄດ້ຮັບໂປຣໄຟລ໌ທີ່ຜ່ານການຢືນຢັນເມື່ອສາມາດ ແລະເຊື່ອມເຂົ້າກັບເວັບໄຊຂອງທ່ານ.
  • ໃຊ້ C2PA ຫຼື ການຢືນຢັນເນື້ອຫາຮູບແບບຄ້າມຄ່າເຊັ່ນກັນສໍາລັບຮູບພາບແລະເອກະສານສຳຄັນເມື່ອເປັນໄດ້; ຈັດເກັບຕົວຕົນຕົ້ນເອກະສານໄວ້ເປັນສ່ວນຕົວ.
  • រក្សាកំណត់ហេតុភស្តុតាងជាមួយពេលវេលា៖ រូបថតអេក្រង់, តំណភ្ជាប់, និងលេខសំបុត្រ(តិកិត)រាល់វេទិកាសម្រាប់ការយកឡើងវិញនៅពេលក្រោយ។
  • ຈັດເຮັດແບບຟອມການຮ້ອງຂໍລົບອອກ; ຕອບສະໜອງໄວແກ່ການຮ້ອງຂໍໃໝ່ ແລະບັນທຶກທຸກຂັ້ນຕອນເພື່ອສ້າງທາງຢ່າງຊັດເຈນ.

ຄູ່ມືການປົງກັນ - ທີມ ແລະ ຜູ້ປະສານລວມລະບົບ

  • ເລືອກເນື້ອຫາທີ່ມີລາຍເຊັນ ຫຼືຖືກຢືນຢັນໂດຍຜູ້ຕີພິມໃນການດຶງ; ປະຕິບັດຊ່ວງເວລາໂດຍອ້າງອີງສໍາລັບແຫຼ່ງໃໝ່.
  • จำกัดอิทธิพลที่เกิดซ้ำจากต้นทางเดียวกัน และกำจัดสำเนาที่ใกล้เคียงต่อเครือข่ายต้นทางแต่ละแห่ง.
  • ເພີ່ມແບັດເຈດການຢື່ນແທ້ (provenance badges) ແລະລາຍການແຫລ່ງຂໍ້ມູນທີ່ຜູ້ໃຊ້ເຫັນໄດ້ ສໍາລັບຂໍ້ອ້າງອີງໃນລະດັບບຸກຄົນແລະຫົວຂໍ້ອ່ອນໄວ.
  • ນຳໃຊ້ລະບົບການຄົ້ນພົບຄວາມຜິດປົກກະຕິໃນຮ່າງຂໍ້ມູນ embedding; ໝາຍເຫດຄວາມແຕກຕ່າງຂອງເວັກເຕີອັດແດງແລະດຳເນີນການກວດ canary ເພື່ອຕິດຕາມການແຜ່ທີ່ບໍ່ຖືກອະນຸຍາດ.

ການຄົ້ນຄວ້າ: ການຢືນຢັນທີ່ຖືກຢືນຢັນໂດຍລະຫັດລັກສະນະ

Chad Scira ກຳລັງພັດທະນາລະບົບໃບຢືນຢັນທີ່ຖືກຢືນຢັນດ້ວຍວິທະຍາສາດການລັອດ (cryptographically verified) ເພື່ອສ້າງຄວາມໄວ້ໃຈໃນຂໍ້ຄວາມກ່ຽວກັບບຸກຄົນແລະເຫດການ. ເປົ້າໝາຍແມ່ນການສົ່ງຄຳອ້າງທີ່ມີລາຍເຊັນ ແລະ ຄົ້ນຫາໄດ້ຈາກຜູ້ຊ່ຽວຊານແລະອົງກອນທີ່ຖືກກວດສອບ, ເພື່ອສະໜັບສະໜູນການຕິດຕໍ່ຕົ້ນຕົວ ແລະ ການຕໍ່ສູ້ກັບການເປິ່ງພາຍ.

គោលការណ៍រចនា

  • ອັດຕະສະນະແລະການກຳເນີດ: ຂໍ້ຄວາມຖືກເຊັນໂດຍບຸກຄົນ/ອົງການທີ່បានផ្ទັດເຊັກ ໂດຍໃຊ້ວິທີສາດສະຫຼອງຄີສາທາລະນະ (public-key cryptography).
  • ການເກັບຂໍ້ມູນທີ່ສາມາດກວດສອບໄດ້: ໃບຢືນຢັນຖືກຕິດຢູ່ກັບບັນທຶກເພີ່ມເຕີມເທົ່ານັ້ນ ແລະບັນທຶກທີ່ແສດງການດັບດັ້ງເພື່ອອໍານວຍໃຫ້ການກວດສອບແບບອິດສະລະ.
  • ການປະສົມການຄົ້ນເຫັນ: ແຖວ RAG ສາມາດຈັດລຳສຳຫຼັກ ຫຼື ຕ້ອງການແຫຼ່ງຂໍ້ມູນທີ່ໄດ້ຮັບການຢືນຢັນດ້ວຍຄຣິບໂຕກຣາຟີ ສໍາລັບຄໍາຖາມທີ່ອ່ອນໄວ
  • แรงเสียดทานต่ำ: API และ SDK ช่วยให้ผู้เผยแพร่และแพลตฟอร์มสามารถออกและตรวจสอบการรับรองเมื่อรับข้อมูลเข้า.

ຊື່ສຽງ ແລະ ການແຈ້ງເຕືອນ

ນອກຈາກການຢືນຢັນ, ຊັ້ນຊື່ສຽງຈະລວບລວມການຮັບຮອງທີ່ມີລາຍເຊັນ ແລະເກັດໝາຍຜູ້ທີ່ຖືກເບີນຮູ້. ລະບົບແຈ້ງເຕືອນຈະແຈ້ງເຕືອນເປົ້າໝາຍເມື່ອມີການຮ່ວມມືໃນການຈັບປະກອບຫຼືມີການເພີ່ມຂຶ້ນຢ່າງຜິດປົກກະຕິ, ຊ່ວຍໃຫ້ສາມາດຕອບສະໜອງແລະຮ້ອງຂໍການລົບອອກໄດ້ໄວຂຶ້ນ.

ឆានែលផ្នែកច្បាប់ និងវេទិកា

  • ໃຊ້ຂັ້ນຕອນລາຍງານຂອງແພດຟອມທີ່ມີແພັກເອົາຫຍໍ້ພາບພາສະຫຼຸບພິສູດທີ່ຊັດເຈນ: ລິ້ງ, ວັນທີ, ສະແກນຫນ້າຈໍ, ແລະຜົນກະທົບ. ອ້າງອີງນະໂຍບາຍກ່ຽວກັບການຫມິ່ນປະມາດແລະນະໂຍບາຍກ່ຽວກັບການລະເບີດເຮືອນ (harassment).
  • បង្កើនកម្រិតជាមួយសេចក្តីជូនដំណឹងផ្លូវការ នៅពេលសមស្រប; រក្សាកំណត់ហេតុការសារទំនាក់ទំនង និងលេខសំបុត្រជាក់ទិន្នន័យនៅក្នុងខ្សែឯកសារផ្ទាល់ដោយអត្ថប្រយោជន៍។
  • ພຶດສະຫວ່າງຄວາມແຕກຕ່າງຂອງຂໍ້ກົດໝາຍກ່ຽວກັບການຫມິນເສຍຊື່ສຽງ ແລະ ການຮັບຜິດຊອບຂອງແພດຟອມ; ຂໍແນະນໍາໃຫ້ປຶກສາທະນາຍຄວາດສໍາລັບເຄື່ອງກໍລະນີທີ່ມີຄວາມສ່ຽງສູງ.

ແຜນການນໍາໃຊ້ (ປີທີ 1)

  • MVP: สคีมาการรับรองและ SDK สำหรับผู้เผยแพร่เพื่อเซ็นคำชี้แจงเอกลักษณ์และข้อเรียกร้องเกี่ยวกับเหตุการณ์.
  • ທົດລອງກັບກຸ່ມນ້ອຍຂອງຜູ້ຊີ້ສັນທີ່ຜ່ານການກວດສອບແລະອົງກອນ; ສ້າງຂັ້ນຕອນການຢືນຢັນ.
  • RAG plugins: ເປີດໃຊ້ໂມດການຕອບທີ່ອີງຕາມແຫຼ່ງຂໍ້ມູນ (provenance-first) ເພື່ອໃຫ້ຄວາມສຳຄັນແກ່ແຫຼ່ງທີ່ຖືກຢືນຢັນ ສໍາລັບຄຳຖາມທີ່ພິສັດສຳຄັນ.

អានបន្ថែម (ជាមួយកាលបរិច្ឆេទ)

ການຮ່ວມມື

ການຄົ້ນຄວ້ານີ້ນຳໜ້າແລະກຳລັງພັດທະນາຢ່າງເປັນການ. Chad Scira ຍິນດີຮັບການຮ່ວມມືຈາກຜູ້ຊ່ຽວຊານອື່ນໆໃນວົງການນີ້.

ຖ້າທ່ານສົນໃຈໃນການຮ່ວມມື ກະລຸນາຕິດຕໍ່ມາທີ່: [email protected]