เมื่อฉันเริ่มต้นอาชีพด้านข้อมูลเมื่อ 15 ปีที่แล้ว ฉันไม่เคยจินตนาการถึงการรีแบรนด์ใหม่ให้กับงานของฉันด้วยการสร้างคำว่า “นักวิทยาศาสตร์ข้อมูล” ไม่ต้องพูดถึงความนิยมอย่างล้นหลามที่ประสบความสำเร็จในช่วงไม่กี่ปีที่ผ่านมา นักวิทยาศาสตร์ด้านข้อมูล ได้รับการพิจารณาอย่างกว้างขวางว่าเป็นหนึ่งในตำแหน่งที่ร้อนแรงและเป็นที่ต้องการมากที่สุดตำแหน่งหนึ่งของโลกกำลังเขียนใหม่ถึงความหมายของ
การเป็นคนเก่งในยุคเทคโนโลยีสมัยใหม่ ไม่เคยมีเวลาที่ดีกว่า
สำหรับเพื่อนเนิร์ดของฉัน งานที่ล้นไปด้วยอุปสงค์มากกว่าอุปทาน อุตสาหกรรมนี้ร้อนแรงมาก ไม่ใช่เรื่องแปลกที่สมาชิกคณะกรรมการของสตาร์ทอัพจะต้องการจ้างนักวิทยาศาสตร์ข้อมูลตั้งแต่ช่วงต้นของวงจรชีวิตผลิตภัณฑ์ ในฐานะที่ฉันถูกเรียกให้ไปพบผู้บริหารบ่อยครั้ง และบ่อยกว่านั้น แจ้งพวกเขาว่าพวกเขาไม่ต้องการนักวิทยาศาสตร์ข้อมูล
ที่เกี่ยวข้อง: ใครเป็นเจ้าของข้อมูลที่ธุรกิจของคุณใช้ การไม่รู้อาจทำให้การขายบริษัทของคุณเสียหายได้
ผู้เผยแพร่ข้อมูลอย่างเช่นตัวฉันเองจะโต้แย้งความสนใจในทุกสิ่งที่วิทยาศาสตร์ข้อมูลกำลังจวนเจียนจะพลิกกลับได้อย่างไร ก่อนที่ฉันจะเริ่มต้น ให้ฉันเริ่มต้นด้วยการบอกว่ามีประโยชน์มากมายสำหรับการจ้างนักวิทยาศาสตร์ข้อมูล! ฉันจะไม่เถียงว่าวิทยาการข้อมูลไม่จำเป็นหรือไม่มีประโยชน์ เพราะเมื่อใช้อย่างถูกต้อง มันคืออาวุธทางธุรกิจที่ทรงพลังอย่างไม่น่าเชื่อ (ใช่ ฉันไปที่นั่นพร้อมกับ “อาวุธ”) ฉันแค่จะเถียงว่ามันเป็นคำที่ใช้มากเกินไปโดยมีการรับรองอย่างเป็นทางการเล็กน้อย ซึ่งหมายถึงกิจกรรมที่เกี่ยวข้องกับข้อมูลจำนวนมาก ไม่ใช่ชุดทักษะที่เป็นระเบียบเรียบร้อยที่สามารถเรียนรู้ได้ในหลักสูตร 12 เดือน ดังนั้น เมื่อถึงเวลาจ้าง องค์กรควรคิดและพิจารณาอย่างแท้จริงว่าองค์กรของคุณต้องการนักวิทยาศาสตร์ข้อมูลประเภทใดและเมื่อใด
เมื่อผู้มีโอกาสเป็นลูกค้ารายใหม่มาหาฉัน อย่างน้อย 50 เปอร์เซ็นต์ของเวลาที่อยู่ภายใต้หน้ากากของ “ซีอีโอ/สมาชิกคณะกรรมการ/ฯลฯ บอกฉันว่าฉันต้องจ้างนักวิทยาศาสตร์ข้อมูล” โดยทั่วไปแล้วฉันจะถามคำถามสี่ข้อต่อไปนี้:
1. คุณมีข้อมูลมากแค่ไหน?
ฉันถามคำถามสี่ข้อ แต่หลายองค์กรไม่เคยผ่านคำถามแรกมาก่อน หากคุณเป็นบริษัทสตาร์ทอัพและยังไม่ได้เปิดตัว คุณไม่จำเป็นต้องมีนักวิทยาศาสตร์ข้อมูลเต็มเวลา หยุดเต็ม อันที่จริง แม้ว่าคุณจะมีชื่อเสียงดีแต่มีฐานลูกค้า/ผลิตภัณฑ์/สมาชิกน้อย คุณไม่จำเป็นต้องมีนักวิทยาศาสตร์ข้อมูลอีก คุณถามทำไม? เพราะไม่น่าแปลกใจที่นักวิทยาศาสตร์ข้อมูลต้องการข้อมูล ไม่ใช่แค่ข้อมูลใด ๆ ที่จะทำ เทคนิคจำนวนมากต้องการจุดข้อมูลอย่างน้อยหลายหมื่นจุดหรือหลายแสนหรือหลายล้านจุดในการสร้าง
ที่เกี่ยวข้อง: 5 สิ่งที่ควรทราบเมื่อใช้ข้อมูลสำหรับปัญญาประดิษฐ์
ขณะนี้มีการมุ่งเน้นอย่างมากในการเรียนรู้เชิงลึก คำอธิบายงานสำหรับนักวิทยาศาสตร์ข้อมูลเต็มไปด้วยคำศัพท์ต่างๆ เช่น โครงข่ายประสาทเทียม วิชันซิสเต็ม และการประมวลผลภาษาธรรมชาติ (NLP) ปัญหา? เทคนิคประเภทนี้ต้องอาศัยข้อมูลการฝึกอบรมจำนวนมหาศาล พิจารณา Google แปลภาษาที่ได้รับความนิยมอย่างแพร่หลาย ซึ่งเป็น
โครงข่ายประสาทเทียมประเภทหนึ่งที่สร้างขึ้นจากคำศัพท์กว่า
150 ล้านคำ ปริมาณข้อมูลที่จำเป็นสำหรับการปรับใช้โมเดลประเภทนี้ให้ประสบความสำเร็จนั้นมีปริมาณมากเกินกว่าที่หลายบริษัทเป็นเจ้าของ
มีเทคนิคมากมายที่ใช้ข้อมูลน้อยกว่าการเรียนรู้เชิงลึก อย่างไรก็ตาม พวกเขายังคงต้องใช้ตัวอย่างจำนวนมากพอสมควร ไม่ต้องพูดถึงความรู้ที่ใช้ได้จริงว่าเมื่อใดควรใช้วิธีการใด ยังมีงานอันมีค่าที่ต้องทำในขั้นตอนนี้เพื่อสร้างสภาพแวดล้อมที่วิทยาการข้อมูลสามารถเติบโตได้ในอนาคต เพียงแค่ไม่ต้องใช้ทรัพยากรเต็มเวลาราคาแพงเพื่อให้บรรลุผลสำเร็จ
2. คุณได้สร้างตัวบ่งชี้ประสิทธิภาพหลัก (KPI) และการรายงานข่าวกรองธุรกิจเป็นประจำหรือไม่?
หากไม่มีความเข้าใจพื้นฐานเกี่ยวกับสิ่งที่ขับเคลื่อนองค์กร การใช้เทคนิคขั้นสูงจะเป็นเรื่องยากมาก ตัวอย่างเช่น นักวิทยาศาสตร์ข้อมูลสามารถใช้แมชชีนเลิร์นนิงเพื่อคาดการณ์ เช่น ผู้ใช้รายใดจะเลิกใช้งานหรือมีการใช้งานสูง อย่างไรก็ตาม หากธุรกิจไม่มีคำจำกัดความสำหรับการเลิกใช้งานหรือใช้งานสูง นั่นจะกลายเป็นข้อกำหนดก่อนที่จะสร้างแบบจำลองการคาดการณ์ . นอกจากนี้ การตรวจสอบความถูกต้องของโมเดลทำได้ยากหากคุณไม่มีเมตริกเพียงพอที่จะประเมินโมเดลเหล่านั้น เทคนิคอื่นๆ เช่น การทดสอบ A/B จำเป็นต้องมีการเลือกขั้นสูงของเกณฑ์การประเมินโดยรวม (OEC) ซึ่งโดยปกติแล้วจะเป็น KPI ที่ขับเคลื่อนด้วยธุรกิจ
ที่เกี่ยวข้อง: 6 คำถามสำคัญเพื่อช่วยให้ธุรกิจตัดผ่าน AI Hype
3. คุณคิดว่านักวิทยาศาสตร์ข้อมูลคนนี้จะทำอะไรเมื่อได้รับการว่าจ้าง?
บางทีอาจเป็นคำถามส่วนตัวและน่าสนใจที่สุดที่ฉันถาม “คุณต้องการให้นักวิทยาศาสตร์ข้อมูลคนนี้ทำอะไร” คำตอบส่วนใหญ่ที่ฉันได้รับคือ “เราไม่รู้ นั่นเป็นเหตุผลที่เราต้องจ้าง” ในกรณีนั้น ฉันจะบอกองค์กรอย่างสุภาพว่าพวกเขากำลังตั้งค่าให้นักวิทยาศาสตร์ข้อมูลล้มเหลว ไม่จำเป็นต้องเป็นผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลในการจ้าง อย่างไรก็ตาม คุณควรมีความคิดที่ดีว่าอะไรเป็นไปได้และเป็นไปไม่ได้ เพื่อที่คุณจะได้ไม่ตั้งความคาดหวังที่ไม่สมจริง