นี่คือแหล่งข้อมูลเปิดฟรีที่ดีที่สุดที่ทุกคนสามารถใช้ได้

พีซี: Flickr

Open Data คืออะไร

กล่าวง่ายๆคือ Open Data หมายถึงประเภทของข้อมูลที่เปิดสำหรับทุกคนและทุกคนในการเข้าถึงการแก้ไขการใช้ซ้ำและการแบ่งปัน

โอเพ่นดาต้าได้มาจากพื้นฐานของ "การเคลื่อนไหวแบบเปิด" เช่นโอเพ่นซอร์สฮาร์ดแวร์แบบเปิดรัฐบาลเปิดวิทยาศาสตร์แบบเปิด

รัฐบาลองค์กรอิสระและหน่วยงานต่างๆได้เตรียมเปิดประตูระบายน้ำของข้อมูลเพื่อสร้างข้อมูลที่เปิดกว้างมากขึ้นเพื่อการเข้าถึงที่ง่ายและฟรี

ทำไมข้อมูลเปิดจึงสำคัญ?

ข้อมูลเปิดเป็นสิ่งสำคัญเนื่องจากโลกมีการขับเคลื่อนข้อมูลเพิ่มมากขึ้น แต่ถ้ามีข้อ จำกัด ในการเข้าถึงและการใช้ข้อมูลความคิดของธุรกิจที่ขับเคลื่อนด้วยข้อมูลและการกำกับดูแลจะไม่เกิดขึ้นจริง

ดังนั้นข้อมูลเปิดจึงมีสถานที่ที่เป็นเอกลักษณ์ มันสามารถทำให้เข้าใจปัญหาทั่วโลกและปัญหาสากลได้อย่างเต็มที่ มันสามารถเพิ่มขนาดใหญ่ให้กับธุรกิจ มันอาจเป็นแรงผลักดันที่ดีสำหรับการเรียนรู้ของเครื่อง สามารถช่วยต่อสู้กับปัญหาระดับโลกเช่นโรคหรืออาชญากรรมหรือความอดอยาก ข้อมูลที่เปิดสามารถเพิ่มขีดความสามารถของประชาชนและด้วยเหตุนี้สามารถเสริมสร้างประชาธิปไตย สามารถปรับปรุงกระบวนการและระบบที่สังคมและรัฐบาลได้สร้างขึ้น มันสามารถช่วยเปลี่ยนแปลงวิธีที่เราเข้าใจและมีส่วนร่วมกับโลก

นี่คือรายการแหล่งข้อมูลโอเพ่น 15 อันยอดเยี่ยมของฉัน:

1. ข้อมูลธนาคารโลกเปิด

ในฐานะที่เก็บข้อมูลที่ครอบคลุมมากที่สุดในโลกเกี่ยวกับสิ่งที่เกิดขึ้นในประเทศต่างๆทั่วโลก World Bank Open Data เป็นแหล่งข้อมูลสำคัญของ Open Data นอกจากนี้ยังให้การเข้าถึงชุดข้อมูลอื่น ๆ เช่นกันซึ่งถูกกล่าวถึงในแค็ตตาล็อกข้อมูล

World Open Open Data มีขนาดใหญ่มากเนื่องจากมีชุดข้อมูล 3000 ชุดและตัวบ่งชี้ 14,000 รายการครอบคลุม microdata สถิติอนุกรมเวลาและข้อมูลเชิงพื้นที่

การเข้าถึงและค้นหาข้อมูลที่คุณต้องการนั้นค่อนข้างง่าย สิ่งที่คุณต้องทำคือการระบุชื่อตัวบ่งชี้ประเทศหรือหัวข้อและมันจะเปิดคลังสมบัติของ Open Data ให้คุณ นอกจากนี้ยังช่วยให้คุณสามารถดาวน์โหลดข้อมูลในรูปแบบต่าง ๆ เช่น CSV, Excel และ XML

หากคุณเป็นนักข่าวหรือนักวิชาการคุณจะได้รับความประทับใจจากเครื่องมือมากมายที่คุณมี คุณสามารถเข้าถึงเครื่องมือวิเคราะห์และสร้างภาพข้อมูลที่สามารถหนุนการวิจัยของคุณ มันสามารถแสดงความยินดีกับความเข้าใจที่ลึกซึ้งและดีขึ้นของปัญหาระดับโลก

คุณสามารถเข้าถึง API ซึ่งสามารถช่วยคุณสร้างการสร้างภาพข้อมูลที่คุณต้องการการใช้งานร่วมกันกับแหล่งข้อมูลอื่นและคุณสมบัติอื่น ๆ อีกมากมาย

ดังนั้นจึงไม่น่าแปลกใจที่ World Bank Open Data ติดอันดับต้น ๆ ของรายการ Open Data!

2. WHO (องค์การอนามัยโลก) - เปิดแหล่งเก็บข้อมูล

พื้นที่เก็บข้อมูล Open ของ WHO เป็นวิธีที่ WHO ติดตามสถิติด้านสุขภาพของ 194 ประเทศสมาชิก

พื้นที่เก็บข้อมูลจัดเก็บข้อมูลอย่างเป็นระบบ สามารถเข้าถึงได้ตามความต้องการที่แตกต่างกัน ตัวอย่างเช่นไม่ว่าจะเป็นอัตราการตายหรือภาระของโรคเราสามารถเข้าถึงข้อมูลที่จัดอยู่ในหมวดหมู่มากกว่า 100 หมวดหมู่เช่นเป้าหมายการพัฒนาแห่งสหัสวรรษ (โภชนาการสำหรับเด็กสุขภาพเด็กสุขภาพแม่และอนามัยเจริญพันธุ์การสร้างภูมิคุ้มกันโรคติดเชื้อ HIV / เอดส์วัณโรคมาลาเรีย โรคที่ถูกทอดทิ้งน้ำและการสุขาภิบาล) โรคที่ไม่ติดต่อและปัจจัยเสี่ยงโรคที่มีแนวโน้มแพร่ระบาดของโรคระบบสุขภาพอนามัยสิ่งแวดล้อมความรุนแรงและการบาดเจ็บความยุติธรรม ฯลฯ

สำหรับความต้องการเฉพาะของคุณคุณสามารถผ่านชุดข้อมูลตามธีมหมวดหมู่ตัวบ่งชี้และประเทศ

สิ่งที่ดีคือคุณสามารถดาวน์โหลดข้อมูลใดก็ได้ที่คุณต้องการในรูปแบบ Excel คุณยังสามารถตรวจสอบและวิเคราะห์ข้อมูลโดยใช้พอร์ทัลข้อมูล

ยังมีข้อมูล API และข้อมูลสุขภาพขององค์การอนามัยโลก

3. Google Public Data Explorer

เปิดตัวในปี 2010 Google Public Data Explorer สามารถช่วยคุณสำรวจชุดข้อมูลสาธารณะที่น่าสนใจมากมาย คุณสามารถเห็นภาพและสื่อสารข้อมูลสำหรับการใช้งานของคุณ

ทำให้ข้อมูลจากหน่วยงานต่าง ๆ และแหล่งข้อมูลพร้อมใช้งาน ตัวอย่างเช่นคุณสามารถเข้าถึงข้อมูลจากธนาคารโลก, สำนักงานสถิติแห่งสหรัฐอเมริกา, สำนักสถิติแรงงานและสำนักงานของสหรัฐอเมริกา, OECD, กองทุนการเงินระหว่างประเทศและอื่น ๆ

ผู้มีส่วนได้เสียที่แตกต่างกันเข้าถึงข้อมูลนี้เพื่อวัตถุประสงค์ที่หลากหลาย ไม่ว่าคุณจะเป็นนักเรียนหรือนักข่าวไม่ว่าคุณจะเป็นผู้กำหนดนโยบายหรือนักวิชาการคุณสามารถใช้เครื่องมือนี้เพื่อสร้างภาพข้อมูลสาธารณะ

คุณสามารถปรับใช้วิธีต่างๆในการแสดงข้อมูลเช่นกราฟเส้นกราฟแท่งแผนที่และแผนภูมิฟองด้วยความช่วยเหลือของ Data Explorer

ส่วนที่ดีที่สุดคือคุณจะพบการสร้างภาพข้อมูลเหล่านี้ค่อนข้างมีชีวิตชีวา หมายความว่าคุณจะเห็นพวกเขาเปลี่ยนแปลงตลอดเวลา คุณสามารถเปลี่ยนหัวข้อมุ่งเน้นไปที่รายการที่แตกต่างและปรับขนาด

มันสามารถแบ่งปันได้อย่างง่ายดายเช่นกัน ทันทีที่คุณได้จัดทำแผนภูมิคุณสามารถฝังไว้ในเว็บไซต์หรือบล็อกของคุณหรือแชร์ลิงก์กับเพื่อนของคุณ

4. การลงทะเบียนของ Open Data บน AWS (RODA)

นี่คือที่เก็บที่มีชุดข้อมูลสาธารณะ เป็นข้อมูลที่มีอยู่ในแหล่งข้อมูล AWS

เท่าที่ RODA เกี่ยวข้องคุณสามารถค้นหาและแบ่งปันข้อมูลที่เปิดเผยต่อสาธารณะ

ใน RODA คุณสามารถใช้คำหลักและแท็กสำหรับข้อมูลประเภททั่วไปเช่นจีโนมภาพถ่ายจากดาวเทียมและการขนส่งเพื่อค้นหาข้อมูลที่คุณต้องการ ทั้งหมดนี้เป็นไปได้ในเว็บอินเตอร์เฟสที่เรียบง่าย

สำหรับชุดข้อมูลทุกชุดคุณจะค้นพบหน้ารายละเอียดตัวอย่างการใช้งานข้อมูลสิทธิ์ใช้งานและบทแนะนำหรือแอปพลิเคชันที่ใช้ข้อมูลนี้

ด้วยการใช้ประโยชน์จากผลิตภัณฑ์การคำนวณและการวิเคราะห์ข้อมูลที่หลากหลายคุณสามารถวิเคราะห์ข้อมูลแบบเปิดและสร้างบริการใด ๆ ที่คุณต้องการ

ในขณะที่ข้อมูลที่คุณเข้าถึงนั้นมีอยู่ในแหล่งข้อมูล AWS คุณต้องจำไว้ว่า AWS ไม่ได้จัดเตรียมไว้ให้ ข้อมูลนี้เป็นของหน่วยงานที่แตกต่างกัน, หน่วยงานราชการ, นักวิจัย, ธุรกิจและบุคคล

5. สหภาพยุโรปเปิด Data Portal

คุณสามารถเข้าถึงข้อมูลใด ๆ ที่สถาบันเปิดของสหภาพยุโรปหน่วยงานและองค์กรอื่น ๆ ที่เผยแพร่บนแพลตฟอร์มเดียวคือสหภาพยุโรปเปิดดาต้าพอร์ทัล

EU Open Data Portal เป็นแหล่งเปิดข้อมูลสำคัญที่เกี่ยวข้องกับโดเมนนโยบาย EU โดเมนนโยบายเหล่านี้รวมถึงเศรษฐกิจการจ้างงานวิทยาศาสตร์สิ่งแวดล้อมและการศึกษา

ประมาณ 70 สถาบันของสหภาพยุโรปองค์กรหรือหน่วยงานเช่น Eurostat, สำนักงานสิ่งแวดล้อมยุโรป, ศูนย์วิจัยร่วมและคณะกรรมาธิการยุโรปอื่น ๆ ผู้อำนวยการทั่วไปและหน่วยงานของสหภาพยุโรปได้เปิดเผยชุดข้อมูลของตนและอนุญาตให้เข้าถึงได้ ชุดข้อมูลเหล่านี้มีค่าเกิน 11700 จนถึงปัจจุบัน

พอร์ทัลช่วยให้เข้าถึงได้ง่าย คุณสามารถค้นหาสำรวจเชื่อมโยงดาวน์โหลดและนำข้อมูลกลับมาใช้ใหม่ผ่านแคตตาล็อกของข้อมูลเมตาทั่วไป คุณสามารถทำได้เพื่อวัตถุประสงค์เฉพาะของคุณ อาจเป็นเพื่อวัตถุประสงค์ทางการค้าหรือไม่ใช่เพื่อการค้า

คุณสามารถค้นหาแค็ตตาล็อกเมตาดาต้าผ่านเครื่องมือค้นหาแบบโต้ตอบ (แท็บข้อมูล) และแบบสอบถาม SPARQL (แท็บข้อมูลที่เชื่อมโยง)

ด้วยการใช้แคตตาล็อกนี้คุณสามารถเข้าถึงข้อมูลที่เก็บไว้ในเว็บไซต์ต่าง ๆ ของสถาบัน EU หน่วยงานและองค์กรต่างๆ

6. FiveThirtyEight

มันเป็นเว็บไซต์ที่ยอดเยี่ยมสำหรับการสื่อสารมวลชนเชิงข้อมูลและการเล่าเรื่อง

มันมีแหล่งข้อมูลที่หลากหลายสำหรับภาคต่างๆเช่นการเมือง, กีฬา, วิทยาศาสตร์, เศรษฐศาสตร์และอื่น ๆ คุณสามารถดาวน์โหลดข้อมูลได้เช่นกัน

เมื่อคุณเข้าถึงข้อมูลคุณจะพบคำอธิบายสั้น ๆ เกี่ยวกับแต่ละชุดข้อมูลเกี่ยวกับแหล่งข้อมูล คุณจะได้รับรู้ว่ามันคืออะไรและวิธีการใช้งาน

เพื่อแสดงข้อมูลนี้ใช้งานง่ายให้ชุดข้อมูลในรูปแบบที่เรียบง่ายและไม่ใช่กรรมสิทธิ์เช่นไฟล์ CSV เป็นไปได้ รูปแบบเหล่านี้สามารถเข้าถึงและประมวลผลได้ง่ายโดยมนุษย์รวมถึงเครื่องจักร

ด้วยความช่วยเหลือของชุดข้อมูลเหล่านี้คุณสามารถสร้างเรื่องราวและการสร้างภาพข้อมูลตามความต้องการและความชอบของคุณเอง

7. สำนักสำรวจสำมะโนประชากรของสหรัฐอเมริกา

สำนักสำรวจสำมะโนประชากรของสหรัฐเป็นหน่วยงานทางสถิติที่ใหญ่ที่สุดของรัฐบาลกลาง มันจัดเก็บและให้ข้อเท็จจริงและข้อมูลที่น่าเชื่อถือเกี่ยวกับผู้คนสถานที่และเศรษฐกิจของอเมริกา

สำนักสำรวจสำมะโนประชากรพิจารณาภารกิจอันสูงส่งเพื่อขยายการบริการในฐานะผู้ให้บริการข้อมูลคุณภาพที่เชื่อถือได้มากที่สุด

ไม่ว่าจะเป็นรัฐบาลกลางรัฐท้องถิ่นหรือรัฐบาลชนเผ่าทุกคนใช้ข้อมูลสำมะโนประชากรเพื่อจุดประสงค์ที่หลากหลาย รัฐบาลเหล่านี้ใช้ข้อมูลนี้เพื่อกำหนดที่อยู่อาศัยใหม่และสิ่งอำนวยความสะดวกสาธารณะ พวกเขายังใช้ประโยชน์จากมันในเวลาที่ตรวจสอบลักษณะทางประชากรของชุมชนรัฐและสหรัฐอเมริกา

ข้อมูลนี้ยังใช้ในการวางแผนระบบขนส่งและถนน เมื่อมันมาถึงการตัดสินใจโควต้าและการสร้างตำรวจและบริเวณดับเพลิงข้อมูลนี้มีประโยชน์ เมื่อรัฐบาลสร้างพื้นที่การเลือกตั้งโรงเรียนสาธารณูปโภค ฯลฯ พวกเขาจะใช้ประโยชน์จากข้อมูลนี้ มันเป็นวิธีปฏิบัติในการรวบรวมข้อมูลประชากรเมื่อทศวรรษที่ผ่านมาและข้อมูลนี้ค่อนข้างมีประโยชน์ในการทำเช่นเดียวกัน

มีเครื่องมือต่าง ๆ เช่น American Fact Finder, Census Data Explorer และ Quick Facts ซึ่งมีประโยชน์ในกรณีที่คุณต้องการค้นหาปรับแต่งและแสดงภาพข้อมูล

ตัวอย่างเช่นข้อมูลด่วนเพียงอย่างเดียวมีสถิติสำหรับทุกรัฐมณฑลเมืองและเมืองที่มีประชากร 5,000 หรือมากกว่า

ในทำนองเดียวกัน American Fact Finder สามารถช่วยให้คุณค้นพบข้อเท็จจริงที่เป็นที่นิยมเช่นประชากรรายได้ ฯลฯ ให้ข้อมูลที่มีการร้องขอบ่อยครั้ง

สิ่งที่ดีคือคุณสามารถค้นหาโต้ตอบกับข้อมูลทำความรู้จักกับสถิติยอดนิยมและดูแผนภูมิที่เกี่ยวข้องผ่าน Census Data Explorer นอกจากนี้คุณยังสามารถใช้เครื่องมือแสดงภาพเพื่อปรับแต่งข้อมูลบนประสบการณ์แผนที่แบบอินเทอร์แอคทีฟ

8. Data.gov

Data.gov เป็นขุมทรัพย์แห่งข้อมูลเปิดของรัฐบาลสหรัฐฯ เมื่อไม่นานมานี้มีการตัดสินใจที่จะให้ข้อมูลทั้งหมดของรัฐบาลฟรี

เมื่อเปิดตัวมีเพียง 47 ตอนนี้มีชุดข้อมูล 180,000 ชุด

เหตุใด Data.gov จึงเป็นทรัพยากรที่ยอดเยี่ยมเพราะคุณสามารถค้นหาข้อมูลเครื่องมือและทรัพยากรที่คุณสามารถนำไปใช้งานได้หลากหลายวัตถุประสงค์ คุณสามารถทำการวิจัยพัฒนาเว็บและแอพพลิเคชั่นมือถือและแม้แต่ออกแบบการสร้างภาพข้อมูล

สิ่งที่คุณต้องทำคือป้อนคำหลักในช่องค้นหาและเรียกดูประเภทแท็กรูปแบบกลุ่มประเภทองค์กรองค์กรและหมวดหมู่ สิ่งนี้จะอำนวยความสะดวกในการเข้าถึงข้อมูลหรือชุดข้อมูลที่คุณต้องการ

Data.gov ตามโครงการ Open Data Schema - ชุดของฟิลด์ที่ต้องระบุ (ชื่อ, คำอธิบาย, แท็ก, อัปเดตล่าสุด, ผู้เผยแพร่, ชื่อผู้ติดต่อ, ฯลฯ ) สำหรับชุดข้อมูลทุกชุดที่แสดงบน Data.gov

9. DBpedia

อย่างที่คุณทราบ Wikipedia เป็นแหล่งข้อมูลที่ยอดเยี่ยม DBpedia ตั้งเป้าหมายที่จะรับเนื้อหาที่มีโครงสร้างจากข้อมูลที่มีค่าที่ Wikipedia สร้างขึ้น

ด้วย DBpedia คุณสามารถค้นหาและสำรวจความสัมพันธ์และคุณสมบัติของทรัพยากรวิกิพีเดียได้ ซึ่งรวมถึงลิงก์ไปยังชุดข้อมูลอื่น ๆ ที่เกี่ยวข้องเช่นกัน

มีชุดข้อมูลประมาณ 4.58 ล้านรายการในชุดข้อมูล DBpedia 4.22 ล้านคนจัดอยู่ในภววิทยา ได้แก่ 1,445,000 คน, 735,000 แห่ง, อัลบั้มเพลง 123,000, 87,000 ภาพยนตร์, วิดีโอเกม 19,000, 241,000 องค์กร, 251,000 ชนิดและโรค 6,000 โรค

มีป้ายกำกับและบทคัดย่อสำหรับหน่วยงานเหล่านี้ในประมาณ 125 ภาษา มีลิงก์ไปยังรูปภาพจำนวน 25.2 ล้านลิงก์ มีลิงก์ 29.8 ล้านลิงก์ไปยังหน้าเว็บภายนอก

สิ่งที่คุณต้องทำเพื่อที่จะใช้ DBpedia คือการเขียนแบบสอบถาม SPARQL กับจุดปลายหรือโดยการดาวน์โหลดทิ้ง

DBpedia ได้รับประโยชน์จากองค์กรหลายแห่งเช่น Apple (ผ่าน Siri), Google (ผ่าน Freebase และ Google Knowledge Graph) และ IBM (ผ่าน Watson) และโดยเฉพาะโครงการอันทรงเกียรติที่เกี่ยวข้องกับปัญญาประดิษฐ์

10. freeCodeCamp Open Data

มันเป็นชุมชนโอเพนซอร์ส ทำไมเรื่องจึงเป็นเพราะช่วยให้คุณสามารถสร้างรหัสโปรเจคโปรโบโร่หลังจากไม่หวังผลกำไรและคว้างานในฐานะนักพัฒนา

เพื่อที่จะทำให้สิ่งนี้เกิดขึ้นชุมชน freeCodeCamp.org ทำให้มีข้อมูลจำนวนมหาศาลทุกเดือน พวกเขาเปลี่ยนเป็นข้อมูลเปิด

คุณจะพบสิ่งต่าง ๆ ในที่เก็บนี้ คุณสามารถค้นหาชุดข้อมูลการวิเคราะห์ของโครงการเดียวกันและแม้กระทั่งการสาธิตขึ้นอยู่กับข้อมูล freeCodeCamp คุณสามารถค้นหาลิงค์ไปยังโครงการภายนอกที่เกี่ยวข้องกับข้อมูล freeCodeCamp

มันสามารถช่วยให้คุณมีความหลากหลายของโครงการและงานที่คุณอาจมีในใจ ไม่ว่าจะเป็นการวิเคราะห์เว็บการวิเคราะห์สื่อโซเชียลการวิเคราะห์เครือข่ายโซเชียลการวิเคราะห์การศึกษาการสร้างภาพข้อมูลการพัฒนาเว็บหรือข้อมูลบอทข้อมูลที่นำเสนอโดยชุมชนนี้มีประโยชน์และมีประสิทธิภาพอย่างยิ่ง

11. ชุดข้อมูล Yelp Open

ชุดข้อมูล Yelp นั้นเป็นส่วนย่อยของอะไรนอกจากธุรกิจของเราความคิดเห็นและข้อมูลผู้ใช้สำหรับใช้ในการแสวงหาความรู้ส่วนตัวและการศึกษา

มีบทวิจารณ์ 5,996,996 รายการธุรกิจ 188,593 ภาพ 280,991 ภาพและเขตเมือง 10 แห่งที่รวมอยู่ในชุดข้อมูล Yelp Open

คุณสามารถใช้มันเพื่อจุดประสงค์อื่น เนื่องจากไฟล์เหล่านี้พร้อมใช้งานเป็นไฟล์ JSON คุณสามารถใช้เพื่อสอนนักเรียนเกี่ยวกับฐานข้อมูล คุณสามารถใช้พวกเขาเพื่อเรียนรู้ NLP หรือตัวอย่างข้อมูลการผลิตในขณะที่คุณเข้าใจวิธีการออกแบบแอพมือถือ

ในชุดข้อมูลนี้คุณจะพบว่าแต่ละไฟล์ประกอบด้วยประเภทวัตถุเดียวหนึ่ง JSON- วัตถุต่อบรรทัด

12. ชุดข้อมูลยูนิเซฟ

เนื่องจากองค์การยูนิเซฟเกี่ยวข้องกับปัญหาที่สำคัญหลากหลายจึงได้รวบรวมข้อมูลที่เกี่ยวข้องเกี่ยวกับการศึกษาการใช้แรงงานเด็กความพิการของเด็กการเสียชีวิตของเด็กการตายของมารดาการตายของมารดาน้ำและการสุขาภิบาลน้ำหนักแรกเกิดน้อยการดูแลฝากครรภ์ปอดบวมมาลาเรีย ความผิดปกติ, การตัด / ตัดอวัยวะเพศหญิง, และวัยรุ่น

ชุดข้อมูลแบบเปิดของยูนิเซฟเผยแพร่ใน IATI Registry: http://www.iatiregistry.org/publisher/unicef ​​ได้รับการสกัดโดยตรงจากระบบปฏิบัติการ (VISION) และระบบข้อมูลอื่น ๆ ขององค์การยูนิเซฟ

สิ่งที่ดีคือมีอัปเดตเป็นประจำเมื่อมาถึงชุดข้อมูลเหล่านี้ ทุกเดือนมีการอัปเดตข้อมูลเพื่อให้ครอบคลุมเชื่อถือได้และถูกต้องมากขึ้น

คุณสามารถเข้าถึงข้อมูลนี้ได้อย่างอิสระและง่ายดาย ในการดำเนินการดังกล่าวคุณสามารถดาวน์โหลดข้อมูลนี้ในรูปแบบ CSV นอกจากนี้คุณยังสามารถดูตัวอย่างข้อมูลก่อนที่จะดาวน์โหลดได้

ในขณะที่ทุกคนสามารถสำรวจและเห็นภาพชุดข้อมูลของยูนิเซฟมีผู้เผยแพร่หลักสามราย:

ช่องทาง AID ที่โปร่งใสของยูนิเซฟ: คุณสามารถเข้าถึงชุดข้อมูลได้ง่ายขึ้นหากคุณใช้พอร์ทัลนี้ นอกจากนี้ยังมีรายละเอียดสำหรับแต่ละประเทศที่องค์การยูนิเซฟทำงานอยู่

สำนักพิมพ์ d-portal: มันเป็นในขณะนี้ใน BETA ด้วยสิ่งนี้พอร์ทัลคุณสามารถสำรวจข้อมูล IATI

คุณสามารถค้นหาข้อมูลที่เกี่ยวข้องกับกิจกรรมการพัฒนางบประมาณ ฯลฯ คุณสามารถสำรวจข้อมูลนี้เป็นประเทศที่ชาญฉลาด

แพลตฟอร์มข้อมูลของผู้จัดพิมพ์: บนแพลตฟอร์มนี้คุณสามารถเข้าถึงสถิติแผนภูมิและตัวชี้วัดของข้อมูลที่เข้าถึงผ่าน IATI Registry ได้อย่างง่ายดาย หากคุณคลิกที่ส่วนหัวคุณสามารถเรียงลำดับตารางจำนวนมากที่คุณเห็นบนแพลตฟอร์ม คุณจะพบชุดข้อมูลจำนวนมากในแพลตฟอร์มในรูปแบบ JSON ที่เครื่องอ่านได้

13. Kaggle

Kaggle นั้นยอดเยี่ยมเพราะมันส่งเสริมการใช้รูปแบบการเผยแพร่ชุดข้อมูลที่แตกต่างกัน อย่างไรก็ตามส่วนที่ดีกว่าคือขอแนะนำอย่างยิ่งให้ผู้เผยแพร่ชุดข้อมูลแบ่งปันข้อมูลของพวกเขาในรูปแบบที่เข้าถึงได้และไม่ใช่กรรมสิทธิ์

แพลตฟอร์มรองรับรูปแบบข้อมูลที่เปิดและเข้าถึงได้ เป็นสิ่งสำคัญไม่เพียง แต่สำหรับการเข้าถึง แต่ยังรวมถึงสิ่งที่คุณต้องการทำกับข้อมูลนี้ ดังนั้น Kaggle Dataset จะกำหนดรูปแบบไฟล์ที่แนะนำในขณะที่แชร์ข้อมูลอย่างชัดเจน

สิ่งที่ไม่เหมือนใครเกี่ยวกับชุดข้อมูล Kaggle คือมันไม่ได้เป็นเพียงแค่ที่เก็บข้อมูล ชุดข้อมูลแต่ละชุดย่อมาจากชุมชนที่ช่วยให้คุณสามารถหารือข้อมูลค้นหารหัสสาธารณะและเทคนิคและกำหนดแนวคิดโครงการของคุณเองใน Kernels

CSV, JSON, SQLite, Archive, Big Query เป็นต้นเป็นประเภทไฟล์ที่ Kaggle รองรับ คุณสามารถค้นหาแหล่งข้อมูลที่หลากหลายเพื่อเริ่มทำงานกับโครงการเปิดข้อมูลของคุณ

ส่วนที่ดีที่สุดคือ Kaggle ช่วยให้คุณสามารถเผยแพร่และแบ่งปันชุดข้อมูลส่วนตัวหรือสาธารณะ

14. LODUM

มันเป็นความคิดริเริ่ม Open Data ของ University of Münster ภายใต้ความคิดริเริ่มนี้ทำให้ทุกคนสามารถเข้าถึงข้อมูลสาธารณะเกี่ยวกับมหาวิทยาลัยในรูปแบบที่เครื่องอ่านได้ คุณสามารถเข้าถึงและนำมาใช้ซ้ำได้ตามความต้องการของคุณ

เปิดข้อมูลเกี่ยวกับสิ่งประดิษฐ์ทางวิทยาศาสตร์และเข้ารหัสตามข้อมูลที่เชื่อมโยงไว้ภายใต้โครงการนี้

ด้วยความช่วยเหลือของข้อมูลที่เชื่อมโยงจึงเป็นไปได้ที่จะแบ่งปันและใช้ข้อมูล ontologies และมาตรฐานเมตาดาต้าที่หลากหลาย ในความเป็นจริงแล้วเห็นว่าจะเป็นมาตรฐานที่ได้รับการยอมรับสำหรับการให้ข้อมูลเมตาและข้อมูลบนเว็บเอง

ทีม LODUM ได้ร่วมมือกับ LinkedUniversities.org และ LinkedScience.org

คุณสามารถใช้ตัวแก้ไข SPARQL หรือแพ็คเกจ SPARQL ของ R เพื่อวิเคราะห์ข้อมูล

แพคเกจ SPARQL ช่วยให้สามารถเชื่อมต่อกับปลายทาง SPARQL ผ่าน HTTP, ก่อให้เกิดแบบสอบถามแบบใช้เลือกข้อมูลหรือแบบสอบถามแบบใช้ปรับปรุงข้อมูล (LOAD, INSERT, DELETE)

15. ที่เก็บการเรียนรู้ของเครื่อง UCI

มันทำหน้าที่เป็นพื้นที่เก็บข้อมูลที่ครอบคลุมของฐานข้อมูลทฤษฎีโดเมนและเครื่องกำเนิดข้อมูลที่ใช้โดยชุมชนการเรียนรู้ของเครื่องสำหรับการวิเคราะห์เชิงประจักษ์ของอัลกอริทึมการเรียนรู้ของเครื่อง

ในที่เก็บนี้มีชุดข้อมูล 463 ชุดเป็นบริการสำหรับชุมชนการเรียนรู้ของเครื่อง

ศูนย์การเรียนรู้ของเครื่องจักรและระบบอัจฉริยะที่มหาวิทยาลัยแห่งแคลิฟอร์เนียเออร์ไวน์เป็นเจ้าภาพและดูแลรักษา David Aha ได้สร้างมันขึ้นมาในฐานะนักศึกษาระดับบัณฑิตศึกษาที่ UC Irvine

ตั้งแต่นั้นมานักเรียนนักการศึกษาและนักวิจัยทั่วโลกใช้มันเป็นแหล่งข้อมูลที่เชื่อถือได้ของชุดการเรียนรู้ของเครื่อง

วิธีการทำงานคือชุดข้อมูลแต่ละชุดมีหน้าเว็บที่แตกต่างกันซึ่งจะระบุรายละเอียดทั้งหมดที่ทราบรวมถึงสิ่งพิมพ์ที่เกี่ยวข้องที่ตรวจสอบได้ คุณสามารถดาวน์โหลดชุดข้อมูลเหล่านี้เป็นไฟล์ ASCII ซึ่งมักจะเป็นรูปแบบ CSV ที่มีประโยชน์

รายละเอียดของชุดข้อมูลถูกสรุปโดยลักษณะเช่นประเภทแอ็ตทริบิวต์จำนวนอินสแตนซ์จำนวนแอ็ตทริบิวต์และปีที่เผยแพร่ซึ่งสามารถเรียงลำดับและค้นหาได้

เปิดพอร์ทัลข้อมูลและเครื่องมือค้นหา:

ในขณะที่มีชุดข้อมูลจำนวนมากที่เผยแพร่โดยเอเจนซี่จำนวนมากทุกปี แต่มีชุดข้อมูลเพียงเล็กน้อยเท่านั้นที่ได้รับการยอมรับ

เหตุผลที่ชุดข้อมูลดังกล่าวมีอยู่น้อยมากที่รักษาไว้ซึ่งทรัพยากรที่มีประโยชน์คือมันเป็นความท้าทายในการพัฒนาจัดการและให้ข้อมูลในแบบที่ผู้คนและองค์กรพบว่ามีประโยชน์และใช้งานง่าย

อย่างไรก็ตามโปรดดูรายชื่อด้านล่างของพอร์ทัลข้อมูลและแพลตฟอร์มเปิดที่สำคัญอื่น ๆ ที่อนุญาตให้ผู้ใช้เข้าถึงข้อมูลเปิดได้ง่าย ๆ ศึกษาผลกระทบและรับข้อมูลเชิงลึกที่มีค่า

  1. การค้นหาชุดข้อมูลของ Google
  2. Dataverse
  3. เปิดชุดข้อมูล
  4. Ckan
  5. เปิดการตรวจสอบข้อมูล
  6. Plenar.io
  7. เปิด Data Impact Map

ข้อสรุป

ข้อมูลที่เปิดเป็นลำดับของวัน โลกเริ่มทยอยเคลื่อนไปสู่ระบบเปิดและข้อมูลเปิดถูกต้องตรงกัน

ธุรกิจและองค์กรที่ใช้ประโยชน์จากข้อมูลที่เปิดจะได้เปรียบในการแข่งขันและจะสามารถครองอนาคต