logo
الأرشيف السوري
logoالأرشيف السوري

حول

المنهجية والأدوات

أدوات ومنهجيات مفتوحة المصدر للتحقيقات مفتوحة المصدر

اطبع المقال

إن الوصول إلى سوريا للتحقيق في انتهاكات حقوق الإنسان والإبلاغ عنها مقيّد ومحفوف بالمخاطر بالنسبة للصحفيين المستقلين، وكالات الأنباء الدولية، هيئات التحقيق التابعة للأمم المتحدة، و منظمات حقوق الإنسان الدولية. وهو السبب الرئيس في اعتماد الأرشيف السوري وغيره من مجموعات التوثيق على محتوى مُتحقّق منه مُنشَأ من قبل مستخدمين للمساعدة في بناء قضايا جنائية، إضافة إلى أبحاث حقوق الإنسان.

يركز فريق الأرشيف السوري على أهمية الشفافية بشدة فيما يتعلق بالأدوات، النتائج، والمنهجيات، إضافة إلى الحرص على إتاحة المحتوى المتحقّق منه للعموم وجعله قابلًا للوصول لكلٍّ من الصحفيين، المدافعين عن حقوق الإنسان، والحقوقيّين الذين يعملون لأغراض الإبلاغ، المساءلة والمناصرة.

يتيح الأرشيف السوري جميع البرمجيات المطوّرة من قبله للعموم بصيغ حرّة ومفتوحة المصدر، حرصًا على تحقيق الشفافية ولضمان استمرار الثقة مع شركائنا والمتعاونين معنا، إضافة إلى السماح بإعادة استخدام هذه البرمجيات وتخصيصها من قبل مجموعات أخرى خارج الأرشيف السوري. يضمن التكامل التقني لأدوات التحقيق مفتوحة المصدر عدم تكرار العمل. يعمل الأرشيف السوري مع تقنيين لتطوير الأدوات مفتوحة المصدر. كما طُوّرت منهجيتنا بالتعاون مع مجموعات أرشفة أخرى، ومحامين وصحفيين.

في نموذج البيانات والتشغيل الخاص به؛ اعتمد الأرشيف السوري على النموذج المرجعي للاكتشاف الإلكتروني الذي طورته كلية الحقوق بجامعة ديوك. أدناه شرح مفصّل لكلٍّ من خطوات هذا النموذج.

الجمع

نعمل بالتعاون مع مجموعات أرشفة أخرى مثل الحقوقيين والصحفيين لتطوير منهجيتنا، ومع تقنيين آخرين لتطوير الأدوات مفتوحة المصدر التي نستخدمها. يمكن أن تكون مصادرنا أفراد ومنظّمات يرسلون لنا المواد مباشرةً، حسابات وسائل تواصل اجتماعي متاحة للعموم، إضافةً لما يُنشر علنًا من معلومات.

1) إنشاء قاعدة بيانات مصادر موثوقة للمحتوى الرقمي

قبل جمع، أرشفة أو التحقق من المواد الرقمية، يجب أن نُنشأ بدايةً قاعدة بيانات مصادر موثوقة للمحتوى البصري. حدّدنا ما يزيد على 3500 مصدر موثوق به، من بينهم صحفيين ومراسلين ميدانيين، دوائر إعلامية أكبر (مثل وكالات الأنباء المحلية والدولية)، منظمات حقوق الإنسان (مثل معهد سوريا للعدالة)، الدفاع المدني السوري (الخوذ البيضاء ),والعيادات والمستشفيات الميدانية المحلية، وغيرها. بدأت العديد من هذه المصادر في نشر أو توفير محتوى بصري في أواخر عام 2011 وأوائل عام 2012 ونشرت أيضاً أعمالاً في وسائل إعلام أخرى ذات مصداقية.

يتم الوصول إلى المحتوى المرئي من خلال منصات التواصل الاجتماعي في المقام الأول (تويتر، فيسبوك، يوتيوب، مواقع الويب، تيليغرام) ، الملفات المُستلمة (مقاطع الفيديو، الصور، ملفات pdf)، ومجموعات بيانات من متعاونيين خارجيين. يتم تتبع التغيّرات في مجموعات البيانات هذه لضمان حفظ جميع الإصدارات.

تُحدّد المصداقية من خلال تحليل ما إذا كان المصدر مألوفاً لنا أو إلى شبكتنا الحالية، وفيما إذا كان محتوى المصدر وتحقيقاته الصحفية موثوقًا بها في الماضي. قد يكون ذلك عبر تقييم المدة التي استمرّ المصدر بنشر المحتوى البصري خلالها ومدى فاعليته.

لتعيين مكان تواجد المصدر؛ تُقيّم قنوات وسائل التواصل الاجتماعيّ لتحديد ما إذا كانت مقاطع الفيديو المحملة متسقة ومعظمها من موقع معيّن، أو ما إذا كانت المواقع تختلف اختلافاً كبيراً. تُحلّل القنوات للتأكد من استخدام الحساب لشعار (لوغو) ومن كون الشعار مستخدمًا باستمرار عبر مقاطع الفيديو. كما تُحلّل القنوات للتحقق من أن المحتوى أصلي من خلال تحديد ما إذا كان القائم على تحميل المواد البصرية يجمع مقاطع الفيديو من مؤسسات إخبارية/حسابات أخرى أو كونه المصدر الأوّل لها.

2) إنشاء قاعدة بيانات مصادر موثوقة للتحقق

أنشأ الأرشيف السوري قاعدة بيانات مصادر موثوقة للتحقق. توفر هذه المصادر معلومات إضافية تُستخدم للتحقق من المحتوى على منصات وسائل التواصل الاجتماعي أو المُرسل من مصدره مباشرةً. يتمّ التحقق من المحتوى من قبل المواطنين الصحفيين، المدافعين عن حقوق الإنسان والعاملين في المجال الإنساني الموجودين في سوريا وخارجها. للحفاظ على نزاهة البيانات، لم يتم إشراك مصادر المحتويات في قاعدة بيانات التحقّق.

3) إنشاء مخطط بيانات وصفية موحد

قبل أن نتمكن من حفظ أي محتوى أو التحقق منه يجب أن نحدّد نظامًا يمكن من خلاله إدارة المحتوى وتنظيمه، وذلك من خلال البيانات الوصفية. فإنشاء مخطط بيانات وصفية يساعدنا على تنظيم المحتوى وإدارته بالإضافة إلى مساعدة المستخدمين في تحديد وفهم ماذا حدث، متى وأين.

في الوقت الذي نعترف به بالحاجة إلى وجود مخطط معياري للبيانات الوصفية من أجل تنظيم المحتوى، نحن ندرك أيضًا أن تنفيذ أي مخطط للبيانات الوصفية هو خيار سياسي للغاية. ونظرًا إلى عدم وجود معايير مقبولة عالميًَا وقانونيًا للبيانات الوصفية، فقد بُذلت جهود لوضع إطار محدد للعمل بالتشاور مع مجموعة متنوعة من هيئات التحقيق الدولية. ومن بينها مشاورات مع أعضاء مكتب مفوض الأمم المتحدة السامي لحقوق الإنسان والآلية الدولية المحايدة والمستقلة بشأن الجرائم الدولية المرتكبة في سوريا (IIIM)، بالإضافة إلى معاهد أرشفة أخرى ومنظمات البحوث وحقوق الإنسان.

تُضاف البيانات الوصفية بعد حفظ المحتوى؛ لكن من المهم تحديد مخطط البيانات الوصفية قبل جمع المحتوى ومعالجته.

الحفظ

إن سير عمل الجمع والحفظ الآمن لدى الأرشيف السوري يضمن عدم فقدان المحتوى الأصلي نتيجة إزالته من قبل منصات المشاركة. ويتم ذلك من خلال جمع وتخزين المحتوى الرقمي بشكل آمن على مخدمات خارجية (backend servers) قبل أن يخضع لعملية تحقق أساسية. ومن ثمّ أخذ نسخ احتياطية منه بشكل آمن على مخدمات في جميع أنحاء العالم. نستخدم لهذه العملية Sugarcube[https://github.com/critocrito/sugarcube]، برمجية مفتوحة المصدر طُوّرت ﻷغراض تحقيقات حقوق الإنسان باستخدام المحتوى المُنشأ من قبل المستخدمين.

Sugarcube هي أداة مصممة لدعم الصحفيين، المنظمات غير الربحية، الباحثين الأكاديميين، منظمات حقوق الإنسان، وغيرهم في تحقيقاتهم باستخدام المصادر المُتاحة للعموم عبر الإنترنت (مثل التغريدات، مقاطع الفيديو، قواعد البيانات العامة، مواقع الويب، وقواعد البيانات عبر الإنترنت).

في هذا المسار نحدّد اللغة، نُوحّد صيغة البيانات (مع الحفاظ على الصيغة الأصلية كذلك). كما نقوم بالتقاط وتنزيل صفحة الويب التي تلقينا المعلومات منها. تحصل الملفات في قاعدة بياناتنا على قيمتي تجزئة hash بالاستناد إلى خوارزمية sha256 و md5 وتُختم بطابع زمني باستخدام Enigio Time، طرف ثالث متعاون. تجزّأ البيانات وتُختم زمنيًا لضمان وإثبات نزاهتها ما يعني عدم التلاعب بها أو تعديلها بعد أرشفتها.

المعالجة

ما إن يُحفظ المحتوى بأمان، تُستخرج البيانات الوصفية من المحتوى المرئيّ، ويُحلّل ويُجمع تلقائيًا باستخدام مخطط البيانات الوصفية الموحّد والمحدّد مسبقًا. قد تتضمن البيانات الوصفية المُحلّلة تفاصيل الموقع والمصدر، والتي قد تكون مفيدة لتحديد الموقع الجغرافي الذي أُنشئ فيه المحتوى.

تُملأ البيانات الوصفية تلقائيًا ويدويًا اعتمادًا على جمعها من مصدر مفتوح أو مُغلق. يمكن الاطلاع على شرح مفصل للبيانات الوصفية بالإضافة إلى قائمة كاملة لأنواع الحقول الخاصة بهذه البيانات على موقع الويب الخاص بنا. تتضمّن البيانات الوصفيّة التي نجمعها وصفًا للعنصر المرئي كما هو في الأصل (مثل عنوان فيديو اليوتيوب)، مصدر المحتوى المرئي، الرابط الأصلي الذي نُشرت فيه اللقطات لأوّل مرّة، المعالم المُميزة التي يُمكن التعرّف عليها، أحوال الطقس (والتي قد تكون مفيدة لتحديد الموقع الجغرافي أو الوقت)، اللغات أو اللهجات الإقليمية المحكية، الملابس أو أي زي رسمي يُمكن التعرّف عليه، الأسلحة والذخائر المُستخدمة، الجهاز المستعمل لتسجيل اللقطات، ونوع محتوى الوسائط.

في مسار المعالجة تُمرّر ملفات الفيديو إلى أُطر رئيسية، إضافة إلى استخدام برمجية تعلّم الآلة V-FRAME.

VFRAME هو مجموعة من برمجيات الإبصار الحاسوبي مفتوحة المصدر مصمّمة لتحقيقات حقوق الإنسان بالاعتماد على مجموعات بيانات كبيرة من الوسائط المرئية. يستخدم VFRAME خوارزميات الكشف عن الأجسام حيث يمكنه الإشار ة إلى محتوى الفيديو الذي يصور أجسامًا محددة مسبقًا، مثل الذخائر العنقودية.

التحقق

يجهّز مسار المعلومات لدينا المحتوى البصريّ للخضوع إلى عملية تحقق أولي. كما يُسجّل أكبر قدر ممكن من البيانات الوصفية وسلاسل معلومات الحفظ. ويتم ذلك لمساعدة المستخدمين في تحديد وفهم متى وأين، وماذا حدث فيما يتعلق بواقعة معينة.

يتضمن التحقق ثلاث عمليات : 1) التحقق من مصدر رفع أو نشر الفيديو ؛ 2) التحقق من موقع تصوير الفيديو. 3) التحقق من تواريخ وأوقات تصوير ورفع الفيديو.

  • التحقق من مصدر نشر الفيديو

في البداية؛ نتأكد من أن مصدر الفيديو موجود ضمن قائمة الأرشيف السوري للمصادر الموثوقة. وإذا لم يكن المصدر موثوقاً به، تُحدّد مصداقيته من خلال العملية المذكورة أعلاه.

قد يُنشر محتوى شبه مكرر في بعض الحالات. على سبيل المثال، إذا كان لدينا مقطع فيديو مدته 30 ثانية وكان هنالك مقطع فيديو آخر مدته 10 دقائق ولكنه يتضمن كل/بعض أجزاء الفيديو الأول؛ فسيتم نشر كلا الفيديوهين ما أمكن التحقق منهما. وبالمثل، تُحفظ فيديوهات الوكالات الإخبارية أو المؤسسات الإعلامية التي تحتوي على كل أو جزء من محتوى مقاطع فيديو أخرى محفوظة، طالما كان التحقق من المحتوى ممكناً. كما يقوم الأرشيف السوري بحفظ النسخ المتكررة إذا كانت من مصادر مختلفة ولم يكن من الممكن تحديد المصدر الأصلي.

قد لا يكون مصدر تحميل الفيديو هو من صوّر المحتوى. في معظم الفيديوهات التي يُتحقّق منها بواسطة الأرشيف السوري تُحدّد الجهة التي رفعت الفيديو فقط بينما يبقى مصوّر الفيديو مجهولاً . تُجرى عملية تحقّق متقدّم في الحالات ذات الأولوية؛ حيث تشمل مرحلة التحليل تحديد مصوّر الفيديو.

  • التحقق من موقع تصوير الفيديو

يمر كل فيديو عبر عملية تحديد موقع جغرافي أساسية للتحقق من تصويره في سوريا. ثم يُجرى تحديد موقع جغرافي معمق للمواد البصرية ذات الأولوية للتحقق من تصويرها في موقع معين. يتم ذلك من خلال مقارنة مراجع مرئية (مثل المباني، الجبال، الأشجار والمآذن) مع صور الأقمار الصناعية من غوغل إيرث و Maxar وكذلك الصور الجغرافية المحددة من خرائط غوغل. كما تُستخدم صور الأقمار الصناعية لتقدير الدمار عند التحقيق في هجمات تستهدف المدنيين والبنى التحتية المدنيّة.

إضافة إلى ذلك؛ يقارن الأرشيف السوري اللغة العربية المحكية في مقاطع الفيديو مع اللكنات واللهجات المحلية المعروفة داخل سوريا بغرض التثبت أكثر من الموقع الجغرافي للفيديو. كما نتواصل -ما أمكن ذلك - بمصدر الفيديو مباشرةً للتحقق من الموقع الجغرافي، ونتشاور مع شبكات الصحفيين العاملين داخل سوريا وخارجها للتحقق من مواقع بعض الحوادث على وجه الخصوص.

  • التحقق من تواريخ وأوقات تصوير ورفع الفيديو

للتأكد من تاريخ وتوقيت حادثة معيّنة؛ نستخدم التوقيت والتاريخ المضمنين في البيانات الوصفية لمقاطع الفيديو التي نتلقّاها مباشرةً. يُستخرج التوقيت والتاريخ باستخدام أداة ExifTool[https://exiftool.org/].

نتحقق من تاريخ التقاط الفيديو عن طريق مقاطعة تاريخ نشره على منصات وسائل التواصل الاجتماعي (مثل يوتيوب، تويتر، فيسبوك و تيليغرام) مع تواريخ التقارير المرتبطة بالحادث نفسه. كما تتم مقاطعة المحتوى البصري الذي جُمع من مصادره مباشرة مع التقارير المتعلقة بالحادث نفسه الذي يتضمنه الفيديو.

تتضمن هذه التقارير:

  • تقارير إخبارية من وسائل الإعلام الدولية والمحلية، بما في ذلك رويترز، وكالة سمارت الإخبارية، مركز حلب الإعلامي، وكالة قاسيون للأنباء، لجان التنسيق المحلية في سوريا؛
  • تقارير حقوق الإنسان التي نشرتها منظمات دولية ومحلية، من بينها هيومن رايتس ووتش، منظمة العفو الدولية، الشبكة السورية لحقوق الإنسان، مركز توثيق الانتهاكات في سوريا، الجمعية الطبية السورية الأمريكية ( سامز ) ، ومنظمة أطباء من أجل حقوق الإنسان؛
  • تقارير تمت مشاركتها من قبل شبكة الأرشيف السوري من المواطنين الصحفيين على تويتر، الفيسبوك و تيليغرام حول الحادثة.

كما تُستخدم أدوات إضافية للتحقق من تاريخ وتوقيت محتوى بصري مثل بحث الصور العكسي في غوغل و تحديد التوقيت بالاستعانة بموقع الشمس.

التحقيق والمزيد من التحليل

في بعض الحالات، أجرى الأرشيف السوري تحقيقات معمّقة مفتوحة المصدر. لم تسمح محدودية الإمكانيات والوقت بتحليل جميع الحوادث بشكل معمّق. ولكن من خلال تطوير سير عمل قابل للتكرار؛ من المأمول أن يساعد الآخرون في هذه الجهود، وفي التحقيق بحوادث أخرى باستخدام منهجيات مشابهة. في صفحة التحقيقات في موقعنا الإلكتروني نظرة عامة مفصّلة على منهجية التحقق المعمّق.

إفادات الشهود

في بعض الحوادث؛ يجمع فريق باحثينا إفادات الشهود أو يشارك بعض المنظمات التي تقوم بذلك. فيما مضى، عملنا مع منظمة سوريون من أجل الحقيقة والعدالة، منظمة العدالة من أجل الحياة، بالإضافة لمنظمات أخرى كان دورها جمع شهادات الناجين، كالمصابين وأسرهم، فضلاً عن روايات شهود العيان (مثل الطواقم الطبية؛ ومدراء المستشفيات؛ وأعضاء فريق الدفاع المدني).

بيانات مراقبة الرحلات الجوية

في حال وجود ادّعاء بقصف جويّ؛ يُحلّل الأرشيف السوري بيانات رصد الطيران ويقاطعها مع المحتوى البصري للتأكد فيما إذا رُصدت رحلات الجوية بالقرب من المواقع التي تم الادعاء بتعرضها لقصف جوي. نستخدم Tableau-public لإجراء هذا النوع من التحليلات.

المراجعة

بمجرد معالجة المواد الرقمية، التحقق منها وتحليلها، تُراجع بعد ذلك لتوخي الدقة. في حال وجود تناقض، يُعاد المحتوى ثانيةً إلى سير عمل الأدلة الرقمية لمزيد من التحقق. إذا اعتُبر المحتوى دقيقاً فإنه ينتقل إلى مرحلة النشر.

للمزيد من المعلومات حول الأدوات والمنهجيات التي نستخدمها، يُرجى التواصل معنا على info [at] syrianarchive [dot] org.

الأرشيف السوري هو مشروع مستقل تمامًا، لا يقبل الدعم المالي من الحكومات المتورطة بشكلٍ مباشر في النزاع السوري. نسعى للحصول على التبرعات من الأفراد لنتمكّن من الاستمرار بعملنا. يمكنكم دعمنا عبر صفحة باتريون الخاصة بالمشروع.

تبرّع
حولتواصل معناالصحافةالشؤون القانونيّة
Mnemonicالأرشيف السودانيالأرشيف اليمني