แฟน ๆ ดีกว่าเทคในการจัดระเบียบข้อมูลออนไลน์


รุ่งโรจน์ไปที่ แฟน ๆ หนึ่งในผู้เสนอชื่อเข้าชิงรางวัล Hugo Awards ในปีนี้คือ Archive of Our Own คลังบทความแฟนเพลงที่มีผลงานเกือบ 5 ล้านชิ้น – เกี่ยวกับขนาดของวิกิพีเดียภาษาอังกฤษและอายุน้อยกว่าหลายปี มันไม่ได้เป็นเพียงแค่ fanfic, fanart, fanvids และ fanworks อื่น ๆ ที่น่าประทับใจอย่างที่พวกเขาทำนั่นทำให้ Archive of Our Own เป็นเกียรติแก่หนึ่งในเกียรติประวัติที่ยิ่งใหญ่ที่สุดในนิยายวิทยาศาสตร์และแฟนตาซี นอกจากนี้ยังเป็นสถาปัตยกรรมของเว็บไซต์เอง

ในช่วงเวลาที่เราพยายามหาวิธีทำให้อินเทอร์เน็ตน่าอยู่สำหรับมนุษย์โดยไม่ใช้ประโยชน์จากมนุษย์คนอื่นในกระบวนการ AO3 (AO3 ถึงเพื่อน) นำเสนอสิ่งที่เทคโนโลยีที่เหลือสามารถเรียนรู้ได้

นี่คือปัญหาที่ผู้ใช้ AO3 เช่นอินเทอร์เน็ตที่เหลือเจอทุกวัน: คุณจะพบสิ่งที่คุณสนใจได้อย่างไรในขณะที่กรองสิ่งอื่น ๆ ทั้งหมดที่คุณไม่สนใจ เว็บไซต์ส่วนใหญ่ลงท้ายด้วยแท็กบางประเภท ฉันอาจมองผ่านฐานข้อมูลวารสารทางการแพทย์สำหรับบทความที่ติดแท็ก "ต้อกระจก" ค้นหาเว็บไซต์ภาพถ่ายสต็อกสำหรับรูปภาพที่ติดแท็ก "นักธุรกิจ" หรือคลิกที่แฮชแท็กสื่อสังคมออนไลน์เพื่อดูสิ่งที่ผู้คนพูดถึงตอนล่าสุดของ #GameOfThrones

แท็กมีประโยชน์ แต่ก็มีปัญหาเช่นกัน แม้ว่า "ต้อกระจก" "นักธุรกิจ" และ #GameOfThrones อาจดูเหมือนแท็กที่ชัดเจนที่สุดสำหรับฉัน แต่บางคนอาจติดแท็กหัวข้อเดียวกันเหล่านี้ "การผ่าตัดต้อกระจก" "นักธุรกิจ" และ #GoT บุคคลอื่นอาจไปด้วย "นิวเคลียร์เส้นโลหิตตีบ" (ต้อกระจกชนิดเฉพาะ), "ชีวิตในสำนักงาน" และ #Denenerys และอื่น ๆ

มีสองวิธีหลักในการจัดการกับปัญหาการติดแท็กการแพร่กระจาย หนึ่งคือการไม่รู้จบอย่างสมบูรณ์ – ให้โปสเตอร์ติดแท็กสิ่งที่พวกเขาต้องการและหวังว่าผู้ค้นหาสามารถค้นหาคำที่พวกเขาต้องการค้นหา ติดตั้งง่าย แต่มีแนวโน้มที่จะนำไปสู่การระเบิดของแท็กเนื่องจากผู้โพสต์ซ้อนทับแท็กเพิ่มเติมในกรณีที่ผู้ค้นหาไม่รู้ว่าอันไหนดีที่สุด แท็ก Laissez-faire นั้นเป็นเรื่องธรรมดาในโซเชียลมีเดีย ถ้าฉันโพสต์ภาพสุนทรียศาสตร์ของหนังสือที่ฉันอ่านบน Instagram ฉันมีแท็กที่เกี่ยวข้องมากกว่า 20 รายการให้เลือกเช่น #book #books #readers #reader #reader #read #goodreads #read #booksofig #booksofinstagram #readersofinstagram #readstagram #bookstagram #bookshelves #bookshelfie #bookshelfie #booknerd #bookworm #bookworm #bookish #bookphotography #bookcommununacy #booklover #booksstagrammer #booktography #readersook #readabook #readtooks #readshare # อ่านเพิ่มเติม "ฉันกำลังอ่าน" แน่นอน – อ่านแท็กเต็มย่อหน้า

โซลูชันอื่น ๆ สำหรับการเพิ่มจำนวนแท็กที่แข่งขันกันคือการนำระบบการติดแท็กที่มีการควบคุมจากบนลงล่างที่เข้มงวดมาใช้ เช่นเดียวกับระบบทศนิยมของดิวอี้มีหมวดหมู่ย่อยเดียวสำหรับเช็คสเปียร์เพื่อให้แน่ใจว่าเบราว์เซอร์ห้องสมุดสามารถค้นหาได้ หมู่บ้านเล็ก ๆ ใกล้ โรมิโอและจูเลียตระบบการแท็กที่เข้มงวดกำหนดรายการแท็กที่ไม่ทับซ้อนกันหนึ่งรายการและกำหนดให้ทุกคนใช้แท็กเหล่านั้น พวกเขาได้รับความนิยมในฐานข้อมูลระดับมืออาชีพและด้านเทคนิคมากกว่าในสื่อสังคมออนไลน์ที่สาธารณะ แต่พวกเขาเป็นความคิดที่ดีในทางทฤษฎี – ถ้าคุณยอมให้แท็ก "ต้อกระจก" แล้วไม่มีใครจะต้องพยายามซ้ำโดยการค้นหาด้วย ต้อกระจก "และ" การผ่าตัดต้อกระจก "

ปัญหาคือแท็กที่เข้มงวดจะพยายามเรียนรู้ เป็นการยากที่จะโน้มน้าวให้ประชาชนทั่วไปจดจำการจัดหมวดหมู่ขนาดใหญ่ นอกจากนี้พวกเขากลายเป็นล้าสมัย ระบบการติดแท็กเป็นวิธีหนึ่งในการสั่งซื้อสินค้าในโลกแห่งความเป็นจริงและโลกนี้ไม่เพียง แต่หยุดยั้งการเคลื่อนย้ายและการเปลี่ยนแปลงเมื่อคุณจัดหมวดหมู่ที่สวยงามของคุณแล้ว ใช้คำที่เกี่ยวข้องกับเพศและเรื่องเพศ: วิธีที่เราพูดถึงหัวข้อเหล่านี้มีวิวัฒนาการมามากมายในช่วงไม่กี่ทศวรรษที่ผ่านมา แต่ฐานข้อมูลห้องสมุดและการแพทย์นั้นช้าลงเพื่อให้ทัน

เอกสารสำคัญของเราไม่มีปัญหาเหล่านี้ ใช้ระบบการแท็กที่สามซึ่งผสมผสานองค์ประกอบที่ดีที่สุดของทั้งสองสไตล์

บน AO3 ผู้ใช้สามารถใส่สิ่งที่ต้องการได้ (การเติมข้อความอัตโนมัติมีไว้เพื่อช่วย แต่พวกเขาไม่จำเป็นต้องใช้มัน) หลังจากนั้นอาสาสมัครของมนุษย์จะค้นหาแท็กใหม่ที่ไม่มีใครใช้มาก่อนและจับคู่กับแท็กที่มีอยู่ซึ่งเป็นกระบวนการที่เรียกว่า แท็กการถกเถียง การถกเถียงหมายความว่าคุณไม่จำเป็นต้องรู้ว่าแท็กยอดนิยมสำหรับแฟนเพลงของคุณที่มี Sherlock Holmes และ John Watson คือ Johnlock หรือ Sherwatson หรือ John / Sherlock หรือ Sherlock / John หรือ Holmes / Watson หรืออย่างอื่น และแน่นอนคุณไม่จำเป็นต้องติดแท็ก fic ของคุณกับพวกเขาทั้งหมดในกรณี แต่คุณเลือกได้ว่าจะเลือกอันไหนแท็ก Wranglers ทำงานอยู่เบื้องหลังและผู้อ่านที่กำลังมองหาคำพ้องความหมายเหล่านี้จะยังสามารถหาคุณเจอได้

เคล็ดลับของ AO3 คือเกี่ยวข้องกับมนุษย์โดยการออกแบบ – ประมาณ 350 อาสาสมัครแท็กแรงเลอร์ในปี 2019, 160 คนจากในปี 2012 – แต่ละคนใช้เวลาไม่กี่ชั่วโมงต่อสัปดาห์ในการตัดสินใจว่าแท็กใหม่ควรได้รับการปฏิบัติเหมือนคำพ้องหรือชุดย่อยของแท็กที่มีอยู่ เหลือคนเดียว Tag Wrangling Chair ของ AO3 คาดการณ์ว่ากลุ่มผู้ใช้แท็กที่ไม่เคยใช้งานก่อนหน้านี้มีมากกว่า 2 ล้านแท็กที่ไม่เคยใช้งานมาก่อนในปี 2019 เพิ่มขึ้นจากประมาณ 1.5 ล้านในปี 2018

ระบบการติดแท็กถูกต้องและล้มเหลวทั้งคู่ล้มเหลวเนื่องจากพวกเขาถือว่ามากเกินไป – ผู้ใช้สามารถสร้างคำสั่งซื้อจากระบบเปิดสมบูรณ์หรือว่าอนุกรมวิธานที่กำหนดไว้ล่วงหน้าสามารถรวมแท็กทุกชนิดที่คนอาจต้องการ เมื่อข้อสันนิษฐานเหล่านี้ไม่ปรากฏออกมาดูเหมือนว่าจะเป็นความผิดของผู้ใช้เสมอ ความเชื่อของ AO3 เกี่ยวกับธรรมชาติของมนุษย์นั้นเป็นไปในทางปฏิบัติมากกว่าเช่นสถาปนิกที่ออกแบบทางเดินที่คนเดินถนนได้เริ่มเสื่อมลงบนหญ้าโดยตระหนักว่าการเปลี่ยนแปลงและมาตรฐานนั้นเข้ากันได้อย่างไร ระบบ Wrangler เป็นระบบที่พฤติกรรมของผู้ใช้ทั่วไปสามารถประสบความสำเร็จได้ซึ่งเป็นระบบที่ยอมรับว่าผู้ใช้ต้องการความช่วยเหลือจากผู้ที่มีมุมมองที่กว้างขึ้น

ผู้ใช้ชื่นชมความช่วยเหลือนี้ ตาม Tag Wrangling Chair briar_pipe "บางครั้งเราได้รับผู้ใช้ที่มาจาก Instagram หรือ Tumblr หรือไซต์ที่ไม่มีผู้ควบคุมอื่นเราสามารถบอกได้ว่าพวกเขายังใหม่กับ AO3 เพราะพวกเขาติดแท็กด้วยแนวคิดที่หลากหลายทุกอย่าง ฉันชอบที่ผู้คนตื่นเต้นเมื่อพวกเขารู้ว่าพวกเขาไม่ต้องทำสิ่งนี้ที่นี่ "

เมื่อฉันทวีตเกี่ยวกับแท็กของ AO3 กลับมาอีกครั้งฉันได้รับความคิดเห็นจำนวนมากจากผู้ที่คิดว่าระบบการติดแท็กมืออาชีพของพวกเขานั้นดีเช่นผู้ใช้เว็บไซต์ข่าวแคตตาล็อกห้องสมุดเว็บไซต์ขายเชิงพาณิชย์เว็บไซต์ช่วยเหลือลูกค้าและ PubMed ฐานข้อมูลที่โดดเด่นของการวิจัยทางการแพทย์) เว็บไซต์อื่นที่เปรียบเทียบกับ AO3 ก็อยู่ในฝั่งของสเปกตรัมและใช้ระบบที่คล้ายกันของการถกเถียงแท็กที่อำนวยความสะดวกโดยมนุษย์: librarything (เว็บไซต์ที่คุณสามารถเขียนรายการหนังสือทั้งหมดของคุณ) และ Danbooru (อิมเมจอนิเมะ) แต่เราอาจถามตัวเองว่าทำไมต้องใช้มนุษย์? ไม่สามารถเรียนรู้ด้วยเครื่องหรือ AI หรือ buzzword ร้อนแรงอีกแท็กแทนแท็กได้หรือ

เหตุผลหนึ่งสำหรับมนุษย์คือ AO3 เริ่มพัฒนากิจวัตรประจำวันในปี 2550 เมื่อเทคโนโลยีไม่ก้าวหน้าและมีอาสาสมัครจำนวนมากที่เต็มใจ แต่ถึงกระนั้นตอนนี้แท็ก Wranglers ยังไม่เชื่อว่าเครื่องจักรสามารถรับภาระงานของพวกเขาได้ Wrangler คนหนึ่งที่ไปตามคันบังคับที่จับได้ชี้ให้ฉันดูตัวอย่างของตัวละครจากละครเสียงที่เรียกว่า The Penumbra Podcast ผู้ที่ไม่มีชื่ออย่างเป็นทางการในข้อความเป็นเวลาหลายตอนหลังจากที่เขาได้รับการแนะนำ แต่ผู้คนกำลังเขียน fanfic และพยายามติดแท็กด้วยตัวอักษรก่อนที่พวกเขาจะมีชื่อใด ๆ ที่จะติดแท็กด้วย

เพราะ spacegandalf ได้ฟังพอดแคสต์นี้ – AO3 จงใจชักชวนและมอบหมายแท็ก wranglers ที่เป็นสมาชิกของแฟนคลับที่พวกเขาทะเลาะกัน – พวกเขามีบริบทที่จำเป็นที่จะต้องรู้ว่า "คนเสื้อแจ็กเก็ตชายหรืออะไรก็ตามชื่อของเขา" ขณะที่ชื่อเล่นทางการของเขา "ชายในชุดแจ็คเก็ตสีน้ำตาล" และต่อมาชื่อทางการ Jet Sikuliaq (และชื่อเหล่านี้ไม่ควรจะสับสนกับตัวละครลึกลับชื่อต่าง ๆ ที่แตกต่างจากละครเสียงชายในตาล แจ็คเก็ตจาก ยินดีต้อนรับสู่ Night Vale)

ด้วยแท็กเหล่านี้ที่มีการถกเถียงอย่างถูกต้องฉันไม่สามารถหา "Big Guy Jacket Man" และ "The Man in the Brown Jacket" และ "Jet Sikuliaq" ทั้งหมดในผลการค้นหาเดียวกัน แต่ฉันยังสามารถเจาะลึกและค้นหา crossover fic มีทั้งผู้ชายในแจ็กเก็ตสีน้ำตาลและชายในแจ็คเก็ตตาล – และหนึ่งความหวังโลกทั้งใบของเพื่อนเสื้อคลุมสี น่าเศร้าที่ไม่มี แต่อย่างน้อยฉันก็รู้ว่าฉันมีคำตอบที่สรุป

หากไม่มีแท็ก wranglers ฉันจะต้องทำการค้นหา "แจ็คเก็ต" หรือ "แจ็คเก็ตชาย" โดยทั่วไปซึ่งเป็นครั้งแรกที่ให้ผลลัพธ์หลายร้อยรายการแก่ฉันเกี่ยวกับตัวละครที่ไม่เกี่ยวข้องอื่น ๆ ที่เกิดขึ้นในการสวมแจ็คเก็ต ซึ่งพลาดผลลัพธ์ที่เกี่ยวข้องอย่างแท้จริงเกี่ยวกับแจ็คเก็ตคนที่เราสนใจ

Qem อีกคนหนึ่งของ Tag Wrangling Chairs ก็คิดว่าไม่น่าจะมีการบิดแท็กของเครื่องจักรชี้ไปที่การแปลด้วยเครื่องเป็นเรื่องเตือน “ มีคำศัพท์ใน fandom ซึ่งในขณะที่เข้าใจกันโดยทั่วไปในหมู่แฟน ๆ จะไม่เป็นเมื่อคุณนำมันออกมาจากบริบท fandom” Qem พูดตัวอย่างเช่นคำที่ดูเหมือนจะไม่เป็นอันตรายเช่น "สแลช" และ "มะนาว" ไม่ได้อ้างอิง เครื่องหมายวรรคตอนหรือผลไม้รสเปรี้ยวในบริบท fannish และแท็ก wranglers ทราบอยู่แล้วว่าการแปลภาษาด้วยเครื่องสามารถจัดการกับตัวอักษรไม่ใช่ความหมายของวัฒนธรรมย่อยร่วมด้วย Qri's briar_pipe เป็นคนร่าเริงมากกว่า: อาจเป็นเรื่องที่น่าสนใจที่จะมี AI / ความเป็นหุ้นส่วนของมนุษย์สำหรับงานประเภทข้อมูลนี้ แต่คุณต้องมีคนที่ตระหนักถึงข้อ จำกัด ของ AI และยินดีที่จะเรียก AIs ว่ามีข้อผิดพลาดหรือไม่เช่นนั้นความร่วมมือนั้นไม่มีประโยชน์ "

AI แน่นอนมีข้อ จำกัด ดูเหมือนว่าจะมีรายงานใหม่ของผลิตภัณฑ์ที่อ้างว่าเป็น AI – กลไก Turk Turk ของ Amazon, M ของ Google, Google Duplex, เครื่องสแกนใบเสร็จรับเงิน Expensify – แต่ในความเป็นจริงแล้วมักเกี่ยวข้องกับฝูงที่มีรายได้ต่ำ นั่นมาจาก AI

แท็ก wranglers บน AO3 ไม่ได้รับเงินเลย องค์กรหลักของหน่วยเก็บถาวรองค์กรเพื่อการทำงานเป็นองค์กรไม่แสวงหากำไรและทุกคนที่เกี่ยวข้องในโครงการเป็นอาสาสมัคร แต่ก็เป็นเรื่องยากที่จะพิจารณาว่าพวกเขา "หาประโยชน์" เช่นมนุษย์ AI Wrangler เป็นเหมือนอาสาสมัครที่แก้ไข Wikipedia หรือดูแลกลุ่ม Facebook แทนที่จะทำงานให้กับ บริษัท ที่ไม่มีส่วนร่วมที่ต้องการแกล้งทำเป็นเครื่องจักรอาสาสมัครเหล่านี้ได้รับประโยชน์จากชุมชนเดียวกับที่พวกเขารับใช้ ธรรมชาติที่มุ่งเน้นชุมชนนี้เป็นหัวใจสำคัญของความสำเร็จของ AO3 – สร้างขึ้นโดยแฟน ๆ ที่เบื่อกับนโยบายการลบเนื้อหาโดยไม่เจตนาของไซต์โฮสติ้ง fanfiction ที่แสวงหาผลกำไรและตัดสินใจซื้อเซิร์ฟเวอร์ของตัวเองสอนตัวเองถึงรหัสและสร้าง ไซต์ที่เป็นสิ่งที่พวกเขาต้องการอย่างแท้จริงรวมถึงระบบการติดแท็กที่ใช้งานได้อย่างไม่น่าเชื่อซึ่งมีทั้งฐานข้อมูลมืออาชีพและแพลตฟอร์มโซเชียลพันล้านดอลลาร์

เมื่อนักเทคโนโลยีคร่ำครวญถึงการครอบงำของอินเทอร์เน็ตที่เพิ่มขึ้นโดย บริษัท ขนาดใหญ่ไม่กี่แห่งมีแนวโน้มที่จะมองหาการตอบโต้หากคุณต้องการในโครงการความร่วมมือเช่น Wikipedia หรือซอฟต์แวร์โอเพ่นซอร์ส แต่แฟน ๆ ก็สร้างสิ่งต่าง ๆ ให้กันได้อย่างอิสระตั้งแต่ยุคแรก ๆ ของอินเทอร์เน็ตและแฟนคลับมีคนจำนวนมากจากกลุ่มประชากรที่มีส่วนร่วมในโครงการที่วิเคราะห์บ่อยกว่านี้ – บางทีอาจเป็นเหตุผลของความสำเร็จของ Archive of Our เองและเหตุผล ว่าความสำเร็จนี้ถูกมองข้ามไป ไม่ว่าจะชนะ Hugo หรือไม่การเสนอชื่อนี้เป็นขั้นตอนเดียวในการนำความสนใจที่สมควรได้รับไปสู่ ​​AO3


เรื่องราวยิ่งใหญ่มากขึ้น