وصف
استيراد البيانات من موقع ويب إلى جداول بيانات Google
يُعد استيراد البيانات عبر الإنترنت إلى جداول بيانات Google مهمة حيوية لمحللي الأعمال والباحثين وأي شخص يتعامل مع البيانات الضخمة.
تعتبر عملية النسخ واللصق من مواقع الويب غير فعالة وعرضة للخطأ، ولكن هناك طرق أفضل.
استيراد البيانات من موقع ويب إلى جداول بيانات Google
تقدم جداول بيانات Google العديد من الطرق لاستيراد البيانات من مواقع الويب. يمكنك استخدام وظائف IMPORT المدمجة أو تثبيت إضافات جداول بيانات Google لاستيراد البيانات بسهولة. تتكون عائلة وظائف IMPORT من IMPORTDATA و IMPORTHTML و IMPORTXML و IMPORTFEED. كل وظيفة مناسبة بشكل أفضل لاستيراد أنواع محددة من البيانات.
لا يمكن لهذه الوظائف الوصول إلى المعلومات الآمنة باستخدام بيانات الاعتماد أو رموز الأمان. في مثل هذه الحالات، ستحتاج إلى تثبيت إضافة جداول بيانات Google للوصول إلى الخدمة واستيراد البيانات إلى جدول البيانات الخاص بك.
1. IMPORTDATA
يمكنك استخدام وظيفة IMPORTDATA لاستيراد البيانات من ملفات CSV أو TSV عبر الإنترنت. هذه هي أسهل طريقة لاستيراد البيانات من الويب إلى جداول بيانات Google نظرًا لأنها تتطلب الحد الأدنى من الإعداد.
1 | =IMPORTDATA(URL, delimeter, locale) |
تجلب IMPORTDATA البيانات وتستوردها إلى جدول البيانات الخاص بك. في الصيغة، URL هو عنوان الملف، delimiter هو الحرف الذي يفصل بين كل حقل في الملف، و locale هو الإعدادات المحلية المحددة التي يجب أن تستخدمها IMPORTDATA .
الحجتان الأخيرتان، delimiter و locale ، اختياريتان. ستبحث IMPORTDATA عبر البيانات وتفترض قيمًا لهذه الوسيطات إذا تركتها فارغة. في معظم الحالات، من الأفضل ترك هاتين الوسيطتين فارغتين.
على سبيل المثال، يمكنك استيراد أسماء الولايات الأمريكية واختصاراتها من ملف CSV باستخدام هذه الصيغة:
1 | =IMPORTDATA("https://people.sc.fsu.edu/~jburkardt/data/csv/crash_catalonia.csv") |
نظرًا لأن وسيطات delimiter و locale فارغة، فإن IMPORTDATA تفترض هذه القيم. لاحظ أن هذه الوظيفة تعمل مع ملفات CSV و TSV ، وليس صفحات الويب. إذا أدخلت عنوان URL لصفحة ويب في IMPORTDATA ، فقد لا تُرجع البيانات المتوقعة أو تؤدي إلى حدوث خطأ.
2. IMPORTHTML
يمكنك استخدام وظيفة IMPORTHTML لاستيراد البيانات من الجداول والقوائم على موقع ويب. تعد هذه الوظيفة بديلاً عمليًا أكثر لـ IMPORTDATA نظرًا لأنها تمكن من استيراد جداول البيانات مباشرةً من صفحات الويب بدون ملف CSV .
1 | =IMPORTHTML(URL, query_type, index) |
في الصيغة، URL هو عنوان صفحة الويب، query_type هو إما table أو list ، و index هو رقم الجدول أو القائمة في صفحة الويب.
على سبيل المثال، يمكنك استخدام IMPORTHTML لاستيراد جدول من مقال على ويكيبيديا:
1 | =IMPORTHTML("https://en.wikipedia.org/wiki/Demographics_of_Germany", "table", 8) |
في هذه الصيغة، تذهب IMPORTHTML إلى عنوان URL المحدد، وتجلب البيانات، وتخرج الجدول الثامن.
بمجرد استيراد البيانات، يمكنك تحليلها باستخدام كل ما تقدمه جداول بيانات Google. على سبيل المثال، يمكنك تنسيق جدول البيانات أو إنشاء مخطط لتصور البيانات.
3. IMPORTFEED
تتيح لك وظيفة IMPORTFEED استيراد البيانات من موجزات RSS أو Atom مباشرة إلى جداول بيانات Google. تعد موجزات RSS أو Atom في الأساس قنوات تقدم تحديثات من مواقع الويب أو المدونات بتنسيق قياسي.
1 | =IMPORTFEED(url, [query], [headers], [num_items]) |
تعد IMPORTFEED سهلة الاستخدام نسبيًا، حيث تتطلب فقط عنوان URL للموجز ومعلمات اختيارية للتصفية والتنسيق. على سبيل المثال، تستورد الصيغة أدناه موجز موقع MakeUseOf إلى جداول بيانات Google:
1 | =IMPORTFEED("https://www.hdegy.net/feed/", ,TRUE) |
لاحظ أن معلمات query و num_items تُركت كإعداداتها الافتراضية. تم تعيين معلمة headers على TRUE ، مما يضيف صفًا للرأس إلى الجدول المستورد.
تُحدِّث IMPORTFEED جدول البيانات تلقائيًا كلما كان هناك عنصر جديد في الموجز.
4. IMPORTXML
IMPORTXML هي دالة IMPORT قوية تتيح لك استيراد البيانات من ملف XML أو صفحة ويب. تتيح لك استخراج أي جزء تقريبًا من البيانات، لكنها أكثر تعقيدًا قليلاً من وظائف الاستيراد الأخرى. صيغة هذه الوظيفة هي كما يلي:
1 | =IMPORTXML(URL, xpath_query) |
في هذه الصيغة، URL هو عنوان صفحة الويب، xpath_query هو استعلام XPath الذي يحدد العقد التي تريد استيرادها. الشرط الأساسي لاستخدام IMPORTXML في جداول بيانات Google هو المعرفة الأساسية بتنسيق XML وكيفية التنقل عبر ملفات XML باستخدام استعلامات XPath .
يمكنك معرفة المزيد عن استعلامات XPath من مقالتنا المتعمقة حول IMPORTXML .
على سبيل المثال، تُخرج هذه الصيغة جدول XML يحتوي على أسماء ووصف بعض النباتات:
1 | =IMPORTXML("https://www.w3schools.com/xml/plant_catalog.xml", "CATALOG/PLANT") |
في هذه الصيغة، تجمع IMPORTXML البيانات في ملف XML ثم تُخرج عقد PLANT التي تعد تابعة لعقدة CATALOG . نظرًا لأن وسيطة الإعدادات المحلية فارغة، تستخدم IMPORTXML الإعدادات المحلية لملف XML .
نظرًا لأن عناوين URL للويب يمكن أن تصبح فوضوية للغاية، فمن الأفضل إدخال عنوان URL في خلية منفصلة والإشارة إلى تلك الخلية في الصيغة.
من خلال معرفة علامات HTML الأساسية واستعلامات XPath ، يمكنك القيام بالكثير باستخدام IMPORTXML . على سبيل المثال، تستخرج الصيغة أدناه جميع عناوين H2 في مقال:
1 | =IMPORTXML(B2, "//*/h2") |
يتمثل القيد الأساسي لـ IMPORTXML في عدم قدرتها على تحليل JavaScript. إذا تم إنشاء البيانات التي تهدف إلى استيرادها ديناميكيًا من خلال JavaScript، فمن المحتمل أن تواجه IMPORTXML أخطاء.
5. استخدام إضافات Google Sheets لاستيراد البيانات
بالإضافة إلى الوظائف المدمجة، تدعم جداول بيانات Google إضافات الطرف الثالث التي تعمل على توسيع إمكاناتها لاستيراد البيانات عبر الإنترنت. توفر هذه الإضافات طريقة ملائمة لاستيراد البيانات من المصادر عبر الإنترنت وتعزيز إمكانات جدول البيانات.
الميزة الرئيسية لهذه الإضافات هي أنها تتيح الوصول إلى الموارد التي تتطلب المصادقة. كل إضافة مناسبة بشكل أفضل لمصادر وأنواع بيانات مختلفة. وبالتالي، فإن اختيار إضافة Google Sheets المناسبة لاستيراد بياناتك يعتمد على نوع البيانات وأصلها.
فيما يلي مجموعة مختارة من الإضافات البارزة التي تسهل استيراد البيانات في جداول بيانات Google:
- Coefficient: Coefficient هي إضافة سهلة الاستخدام لجداول بيانات Google مصممة لمساعدتك في جلب البيانات من مواقع الويب دون كتابة التعليمات البرمجية. من خلال واجهته، يمكنك تحديد عناصر بيانات محددة لاستيرادها والاستمتاع بالتحديثات في الوقت الفعلي. تدعم Coefficient أنظمة العمل مثل Salesforce و Hubspot و Google Analytics و Redshift و Looker و Tableau و MySQL والمزيد.
- Coupler.io: Coupler.io هي إضافة ممتازة أخرى تجعل من السهل استيراد البيانات إلى جداول بيانات Google. بصرف النظر عن استيراد البيانات من مصادر مختلفة، فإن Coupler.io تمكنك من جدولة عمليات الاستيراد التلقائية للحفاظ على تحديث جدول البيانات الخاص بك. تعمل Coupler.io بسلاسة مع Google Analytics و Mailchimp و HubSpot و Salesforce و Shopify و Xero و Airtable و Trello والمزيد.
- Awesome Table: بخلاف مجرد استيراد البيانات، تتيح لك Awesome Table تخصيص البيانات وتحويلها لتعزيز تحليل البيانات. تتيح لك Awesome Table اختيار البيانات التي سيتم استيرادها باستخدام فلاتر البيانات البديهية وجدولة التحديث التلقائي. تعمل مع QuickBooks و Xero و HubSpot و Airtable و Notion و YouTube والمزيد.
بغض النظر عن نوع البيانات التي تتعامل معها، فإن نسخها ولصقها من المصادر عبر الإنترنت إلى جدول البيانات الخاص بك لا يبدو صحيحًا. لحسن الحظ، تحتوي جداول بيانات Google على وظائف مضمنة ومجموعة من إضافات الطرف الثالث لتسهيل استيراد البيانات، وأنت تعرف الآن كيفية استخدامها.
No data found