http://www.youtube.com/watch?v=qtybUT0UgGI
http://alyaseer.net/vb/showthread.php?t=21937
http://alyaseer.net/vb/showthread.php?t=21937
المكتبات الرقمية
Digital Library
إعداد: لمى غسان الكلاس
ليزا عبدي أباظة
المستخلص:
يهدف البحث إلى التعريف بالمكتبات الرقمية بشكل عام وميزاتها وتنظيمها وكذلك يهدف إلى التعريف بنظام Green Stone ونشر خصائصه الفنية بين المتخصصين في مجال المعلومات لبناء مكتبة رقمية شخصية التي أصبحت من المستلزمات الضرورية لجميع المتخصصين في مجال البحث والتدريس .
كذلك تحدثنا عن نظام الفهرس الآلي في مكتبات جامعة أكسفورد والمكتبة الرقمية التابعة لها والمكتبات التابعة لنظامها كنموذج للمكتبات الرقمية.
المقدمة :
يحدد مؤرخو المعلومات ومؤسساتها خمسة اختراعات، أو بالأحرى خمسة ثورات كبرى ، في قطاع المعلومات ، تبدأ باختراع الكتابة ، مروراً باكتشاف صناعة الورق ، ثم باختراع الطباعة ، فالحاسوب ،وانتهاء بشبكة المعلومات العالمية ( الانترنيت ) .
ومن التأثيرات الهامة التي أفرزتها الإنترنت في قطاع المعلومات مساعدتها على انتشار ما يعرف بالمكتبات الرقمية التي بدأت تستحوذ على اهتمام مختصي المعلومات، فنشر حول الموضوع العديد من الدراسات ونظمت المؤتمرات والندوات العلمية لتدارس مختلف جوانبها ، وأساليب تنظيمها وإدارتها، والتخطيط لها وتصميمها.
فمفهوم المكتبة الرقمية يدل على نظام معلومات تكون فيه موارد المكتبة متوفرة في شكل يعالج بواسطة الحاسوب ، وفيه تستند جميع وظائف الاقتناء والحفظ والاسترجاع والإتاحة إلى تكنولوجيا الرقمنة.
والرقمي مرتبط بآلية إضافة النص فهو يبدأ من الفكرة إلى التنفيذ وصولا إلى النشر من خلال الحاسوب الذي يعتمد على الرقمين 0 ، 1 ، ومن هذا آتى مصطلح المكتبات الرقمية.
تعريف المكتبة الرقمية :
المكتبات الرقمية هي مجموعة من المصادر الالكترونية والإمكانات الفنية ذات العلاقة بإنتاج المعلومات، و البحث عنها واستخدامها.... وبذلك فإن المكتبات الرقمية هي امتداد ودعم لنظم خزن المعلومات واسترجاعها التي تدير المعلومات الرقمية بغض النظر عن الوعاء سواء كان نصياً أو صوتياً أو في شكل صور بنوعيها الثابت وغير الثابت، وتكون متاحة على شبكة موزعة. ( الكميشي،2004 ، ص8 )
مشكلة المصطلحات:
ظهرت العديد من المفاهيم والتعريفات والمسميات العصرية للمكتبة الرقمية، وهي مسميات متداخلة إلى حد كبير ومن هذه المسميات:
المكتبة الالكترونية
|
Electronic Library
|
المكتبة المهجنة
|
Hybrid Library
|
المكتبة الافتراضية
|
Virtual Library
|
مكتبة المستقبل
|
Library Of Future
|
المكتبة الرقمية
|
Digital Library
|
مكتبة بدون جدران
|
Lib. With out wall
|
البوابات
|
Portals
|
رغم كثرة المصطلحات إلا أنه لم يستخدم منها سوى ثلاث مصطلحات تعتبر هي الأكثر شيوعاً و هي :
§ المكتبات الرقمية : Digital Libraries
هي المكتبة التي تملك مصادر إلكترونية محسبة فقط، ولا تستخدم مصادر تقليدية مطبوعة بغض النظر عن أن تكون متاحة على الانترنت أو لا.
§ المكتبات الافتراضية : Virtual Libraries
هي مكتبة موجودة على الانترنت وليس لها مكان على الواقع.
§ المكتبة الالكترونية : Electronic Library
المكتبة الالكترونية لها معنيان وهما:
1- هي المعنى الشامل الذي يشمل كل المصطلحات.
2- هي مكتبة عكس الافتراضية لها موقع على الانترنت ومكان في الواقع.
وتختلف المكتبات الرقمية عن المكتبة الالكترونية بأنها تعتمد على فكرة خزن المعلومات واسترجاعها وتوفير إمكانية الوصول إلى خدمات هذه المكتبات بواسطة توفير مداخل عن بعد Remote Access تمكن المستفيد ( المستخدم ) من استخدام مصادر المعلومات الالكترونية بشكلها الالكتروني وطباعتها على ورق من مختلف مكتبات العالم.
يتضح من خلال استعراض المصطلحات السابقة أن بعضها قد يستخدم تبادلياً كما هو الحال بالنسبة للمكتبات الالكترونية، والافتراضية، وكذلك مكتبات بلا جدران، ومن حيث توفر نصوص الوثائق في أشكالها الالكترونية المختزنة على الأقراص الليزرية، أو المرنة، أو الصلبة، أو من خلال البحث بالاتصال المباشر. أما المكتبة الرقمية فتمثل الوجه المتطور للمكتبة الالكترونية من حيث تعاملها مع المعلومات كأرقام ليسهل تخزينها وتناقلها في تقنيات المعلومات والاتصالات واستثمارها وتداولها الكترونياً بأشكال رقمية. ( الرباعي، 2003 ، ص 8-9 ، 11 )
تاريخ المكتبة الرقمية:
يمكن تحديد مرحلتين أساسيتين في تاريخ المكتبات الرقمية هما:
§ المرحلة الأولى: أسهمت بعض المؤسسات مثل مؤسسة العلوم القومية ( NSF)، و وكالة ناسا ( NASA) بشكل فاعل في تمويل مشروعات بحث رائدة في بداية التسعينيات وأواسطها.
§ المرحلة الثانية: أدى النجاح الذي تحقق في المرحلة الأولى إلى ظهور المرحلة الثانية التي جاءت داعمة للمرحلة التي سبقتها، ويتمثل الدعم فيما يلي:
· تغطية أوعية مختلفة تشمل الأشرطة الصوتية والموسيقى والبيانات الاقتصادية والبرمجيات والفيديو والمواد النصية.
· تنويع المحتوى ليشمل مواد النماذج الأنتربولوجية و الصور والمخطوطات الأدبية وسجلات المرضى.
· استكشاف قضايا تكنولوجية جديدة مثل أمن المعلومات والتصنيف الآلي ومصدر المعلومات.
· تضافر الجهود نتيجة لارتفاع عدد الوكالات الممولة لمشاريع المكتبات الرقمية وتنوعها. ( بروفي ، 2006 ، ص 26 )
المكتبات الرقمية الشخصية:
بعد مراجعة النتاج الفكري العربي والعالمي في مجال المعلومات للتعرف على ما كتب عن هذا الموضوع لوحظ إن هذا المصطلح لا يزال جديد على المتخصصين في مجال المكتبات والمعلومات ومن النادر أن تجد بحث أو دراسة تناولته بشكل مباشر على حد علم الباحث، فضلا عن ذلك هناك الكثير من المصنفات الرقمية تناولت موضوع المكتبات الرقمية وبدرجة أقل من المكتبات الشخصية كلا على حدة. ويمكننا تعريف المكتبات الرقمية الشخصية Personal Digital Libraries على أنها بيئة خزن الكترونية تجمع فيها الكتب والدوريات ومصادر المعلومات الأخرى في هيئتها الرقمية باستخدام النظم والبرمجيات التي تسمح للمستفيد بالوصول إليها آليا وتصفحها لأغراض الإفادة منها. ويشترط فيها التخصص الموضوعي الذي ينسجم مع اهتمامات الشخص المسؤول عن تجميعها. وعليه يمكن تحديد مجموعة للخصائص التي تنسجم مع هذا التعريف:
1- يجب أن تكون مجموعتها من مصادر معلومات رقمية ومخزنة في وسائط خزن الكترونية.
2- يجب أن تلبي مجموعتها المتطلبات الموضوعية لشخص معين.
3- يجب استخدام برمجيات خاصة تسمح بعملية الاسترجاع والتصفح.
4- يجب أن تكون المجموعة قابلة للتحديث بالإضافة والحذف.
وعليه يمكن القول إن الكثير منا يمتلك بشكل أو بآخر مكتبة رقمية شخصية، على سبيل المثال عندما نجمع في قرص مدمج عدد من مصادر المعلومات التي نجدها تلبي احتياجاتنا المختلفة في البحث والدراسة والاستطلاع فهذا يعني إننا نمتلك مكتبة رقمية. وهذا المعنى ينطبق على قيام البعض بتخزين مجموعة من المصادر التي يتم تحميلها من الانترنت على حاسوبه الشخصي في مشغل خاص ، وقد يعمل على توزيعها في مجموعة من المجلدات حسب التخصص الموضوعي للإفادة منها مستقبلا، إن هذه النماذج ينقصها الخاصية الثالثة وهي وجود برمجيات معينة تسمح بتحميل المصادر وتتيح عملية الوصول المنطقي إلى محتواها وفقا لآليات بحثية تمكن المستفيد من استرجاع المحتوى النصي بدلالة الكلمات المفتاحية أو العناوين أو الموضوعات ..... الخ. وبالرغم من وجود برمجيات عديدة تمكن من تنفيذ هذه العملية إلا أن برنامج Green Stone يتميز بخصائص فريدة تجعله مناسباً لتنفيذ بناء المكتبات الرقمية عموما والمكتبات الشخصية بشكل خاص. ( الزهيري ، 2004 ، ص 261-262 ، 264)
برنامج Green Stone:
يعد من البرامج التي تدعمها المنظمة العالمية للتربية والعلوم والثقافة UNESCO لتحويل محتوى قواعد البيانات والملفات النصية إلى مكتبات رقمية متكاملة ويسمح بتحويل تلك المكتبات على أقراص مدمجة أو نشرها على الانترنت. ويتمتع هذا البرنامج بخصائص عديدة من أهمها:
1- يدعم النظام واجهات عمل بالغات عديدة منها اللغة العربية ويسمح ببناء مكتبات رقمية لمحتوى نصي للوثائق والمستندات بمختلف اللغات.
2- يدعم النظام عمليات تحويل قواعد بيانات نظامCDS/ISIS بإصدارات DOS و WINDOSEإلى مكتبات رقمية.
3- يسمح النظام ببناء مكتبات رقمية بالنص الكامل.
4- يدعم النظام تقنية النص المترابط والوسائط المتعددة.
5- سهل الاستخدام ولا يتطلب خبرة برمجية لتنفيذ عملية بناء المكتبات الرقمية.
6- يتعامل النظام مع مختلف أنواع المستندات والوثائق بغض النظر عن البرنامج المستخدم في تحريرها.
7- يعد من البرامج مفتوحة المصدر والذي يمكن تعديله لمتطلبات المستخدم.
8- يوفر النظام آلية لتحميل الملفات النصية من الانترنت مباشرة.
9- يسمح النظام بنقل محتوى المكتبات الرقمية إلى الأقراص المدمجة ويمنحها إمكانية التشغيل الذاتي.
10- يسمح النظام بنشر المكتبات الرقمية على شبكة الانترنت.
11- يوفر النظام آلية بحث متطورة لأغراض استرجاع المعلومات باستخدام العوامل المنطقية.
خطوات بناء المكتبة الرقمية الشخصية:
1- تهيئة المستندات.
2- تحميل البرنامج والإعدادات الأولية.
3- تعريف المكتبة الرقمية.
4- مرحلة التجميع.
5- مرحلة التصميم.
6- بناء المكتبة. ( المرجع السابق ، ص 270-271 )
مميزات المكتبة الرقمية عن المكتبة التقليدية:
§ تكون السيطرة على أوعية المعلومات الإلكترونية سهلة وأكثر دقة وفاعلية من حيث تنظيم البيانات والمعلومات وتخزينها وحفظها وتحديثها مما ينعكس على استرجاع الباحث لهذه البيانات والمعلومات.
§ يستفيد الباحث من إمكانات المكتبة الرقمية عند استخدامه لبرمجيات معالجة النصوص ولبرمجيات معالجة الترجمة الآلية عند توافرها، والبرامج الإحصائية فضلاً عن الإفادة من إمكانيات نظام النص المترابط الوسائط المتعددة.
§ إمكانية الحصول على المعلومات والخدمة بعد تخطي الحواجز المكانية والحدود بين الدول والأقاليم واختصار الجهد والوقت، وبإمكان الباحث أن يحصل على كل ذلك وهو في مسكنه أو مكتبه الخاص.
§ يمكن البحث والاستعارة منها في كل الأوقات ومن على بعد.
§ إمكانية الاستفادة من الموضوع ومطالعته من قبل عدد كبير من الباحثين في وقت واحد.
§ تساعد في نشر الوعي الثقافي الرقمي وتشجيع الباحثين والمؤلفين على الاستفادة من الوسائط المتعددة.
§ مواكبة التقدم في العالم واستغلال وجود تسهيلات أكبر للوصول إلى شبكات المعلومات.
§ الخدمة ذاتية وبالتالي يقل العبء على المكتبة.
§ أنها أقل تكلفة. ( الزهري ، 2001 ، ص 111- 112 )
المكتبة الرقمية في الوطن العربي:
إن الحديث عن المكتبة الرقمية في وطننا العربي دونه الكثير من المعوقات لا سيما إذا لاحظنا أن المكتبات التقليدية ما زالت هي الغالبة كما أن معظمها يفتقر إلى الميكنة وبعضها يستمر في اعتماد التوثيق الورقي لمحتوياته.
فمهمة الانتقال من العصر اليدوي إلى العصر الرقمي مازالت في بديتها وهي محط اهتمام الباحثين في هذا المجال في الوطن العربي في محاولة لتقليص أو حل بعض مشاكلها، كما أن المكتبات العربية تعاني من مشاكل عدة لا سيما في التمويل، وقد أفادت هذه المكتبات البعض الآخر بالفهرسة على الحاسب الآلي وبقي بعضها يستخدم نظام البطاقات القديم في التوثيق في حين تسعى مجموعة منها لأن تكون رقمية وهي مجموعة محدودة جدا في الدول العربية. ( حشمت ، 1993 ، ص 141، 143 )
استرجاع المعلومات الرقمية وآلياته:
يعتبر استرجاع المعلومات الإلكترونية وافداً جديداً يفتقر إلى تقاليد راسخة نجدها سائدة في عالم المطبوع. وتطرح الأوعية الإلكترونية المادية ( Material digital documents) مثل: الأقراص المدمجة (CD-Rom) والأقراص المرنة (Floppy Discs) وأقراص DVD مشكلات أقل حدّة من تلك التي يواجهها مختصو المعلومات في مجال استرجاع الوثائق الإلكترونية غير المادية Non-material digital documents) ) التي تعتبر الوثائق المتاحة على الخط المباشر أبرز مثال لها. فكما أشرنا إلى ذلك فيما سبق فإن الفئة الأولى من الوثائق الإلكترونية تم دمجها ضمن بقية مجموعات أوعية المعلومات، وبالتالي فإن فهارس المكتبة تتولى مهمة توفير البيانات الببليوغرافية الضرورية لاسترجاعها. كما أن تلك الأوعية ( أقراص مرنة أو مدمجة ) غالباً ما تصدر في عدد من النسخ، وهو ما يجعل التعرف إليها أمراً يسيراً. يضاف إلى ذلك أن بعض الببليوغرافيات الجارية بما في ذلك الببليوغرافيات الوطنية عادة ما تحصر هذه الفئة من الأوعية الإلكترونية وتوفر بيانات عنها. وتزداد مهمة التعرف إلى المصادر المتاحة على الخط المباشر واسترجاعها صعوبة لأن جزءاً منها له طابع داخلي ومخزن على حواسيب داخلية لا يمكن الوصول إليه بسهولة إلا عن طريق الإنترنيت ( Intranet ) أو لأنها محمية بواسطة برنامج أمني يعرف بجدران النار ( Fire Walls )، وهو ما يجعل التعرف عليها واسترجاعها وتنزيلها غير ممكن.
وباستثناء الحالات التي أشرنا إليها يبقى العديد من الوثائق الإلكترونية المتنوعة متاحة بالمجان على الإنترنت. كما أنه حتى المكتبات العامة الصغيرة يمكن أن تكون لها مواقع على الإنترنت تقدم معلومات رقمية تتمتع بالأصالة وذات قيمة كبيرة في كثير من الأحيان. لكن من المؤسف أن الوصول إلى مثل تلك الوثائق يعد أمراً صعباً؛ لأن التعرف إلى المواقع التي تتضمن تلك الوثائق يشكل في حد ذاته تحدياً كبيراً.
إن استرجاع الوثائق الرقمية المادية وعلى رأسها الأقراص المدمجة ( CD- Rom) يعد أمرًا يسيرًا نسبيًا لأنه توجد أدلة مهنية ( Professional Directories ) يرجع البعض منها إلى 20 سنة تقوم بتغطية معظم ما ينشر في المجال. فهي تقوم بحصر الأقراص المدمجة التي تصدر في عدة نسخ، وهي غالبًا ما تغطى من قبل فهارس المكتبات التي توجد بها.
إن استرجاع الوثائق الرقمية المتاحة على الخط المباشر يعتبر حديث العهد وأكثر تشعبًا. وسيزداد حجم هذه الفئة من الوثائق في المستقبل.
وبالرغم من القوة التي تتمتع بها محركات البحث والأدلة الموضوعية ومحركات البحث الكبرى، فإن النتائج التي يمكن أن تفضي إليها لا تتميز بالشمولية. فهي تقوم بما يعرف بالتكشيف غير المقيد، وهو ما يجعل سلبيات ذلك النوع من التكشيف تنعكس على عملية البحث التي تستخدم فيها تلــــــــــــــــــك الأدوات. ( بوعزة ، 2006 ، ص 56-57-58 )
تنظيم المكتبات الرقمية :
إن تنظيم المكتبات الرقمية مسألة متشعبة مقارنة بما هو عليه الحال بالنسبة للمكتبات التقليدية ، إن تنوع الخصائص التقنية والقانونية أو التجارية لأوعية المعلومات الالكترونية يجعل مهمة المكتبي أكثر صعوبة.
يجب على أمناء المكتبات أن يدركوا أن مجموعات المكتبة تشكل وحدة كلية منسجمة، كما يجب أن تكون تلك الرؤية سائدة لديهم بالرغم من أن الوثائق الالكترونية تتطلب قواعد خاصة في مجال الاستخدام غالبا ما تحدد من قبل منتجيها، وبالرغم أيضا من أن استخدام تلك الوثائق يتطلب أجهزة تقنية خاصة، وعليه، يجب اعتماد المقاربة الثقافية والقواعد المهنية المتعارف عليها نفسها في معالجة الأوعية التقليدية في التعامل مع مختلف العناصر الجديدة المكونة لمجموعات المكتبة، وحاصل القول أنه ينبغي تغليب المضمون على الشكل وليس العكس، فإذا أردنا ألا يتيه المستفيد داخل مجموعات المكتبة وأن يجد طريقه بسهولة، ينبغي التعامل مع مختلف مصادر المعلومات بالمكتبة بطريقة منسجمة ومتسقة. ( المرجع السابق، ص 15-16 )
المكتبة الرقمية لجامعة أكسفورد ODL (Oxford Digital Library )
تعد مكتبة أكسفورد الرقمية عنصر مهم وبوابة جامعة أكسفورد للاستراتيجية الرقمية لخدمات نظامها الالكترونيOLIS إلى العالم. لقد أنشئت عام 2002 من أجل إيجاد عمل ذكي وخلاق لتطوير البنى التحتية لتقنية ورقمنة كل خدماتها، ومن أجل دخول مباشر إلى مجاميع المكتبات الواسعة في الجامعة. إن ODL يحمل دورا كبيرا في توفير المساواة في الأهمية في تنشيط عمليات الرقمنة في الجامعة.
إن المكتبة الرقمية لمكتبة جامعة أكسفورد تعد مكتبة هجينة ( Hybrid Library ) للمصادر الرقمية التي توفرها، إذ عليها أن توفر التكامل فيما بين الرقمية والتقليدية، وهي تشمل سلسلة طويلة من المواد المكتبية المطبوعة: المصغرات و الأشكال الالكترونية ( الالكترونية والرقمية ) على الأقل لحين تكامل المواد الموجودة في مستودعاتها وتهيئتها للنشر، كما أنها تخطط لبناء مجموعة جيدة من المصادر الرقمية للإتاحة المحلية أو المباشر، وهو الهدف الرئيس منها في تمكين مجاميعها التقليدية من إتاحتها على الخط المباشر. كما أنها ستقوم على الترويج لمجموعتها المكتبية الرقمية إلى العالم، داعمة بذلك سمعة ومكانة جامعة أكسفورد عالميا.
لذا فإن استخدام المعايير في معالجة التحول الرقمي ولوصف المصادر الرقمية هو من أولويات المشاريع المدعمة ماليا لها، كما أنها تخطط إلى توفير خبرتها و تجاربها في مجال الرقمنة إلى المشاريع الأخرى وتقديم الاستشارات الفنية لها، يبقى أن نقول مكتبة أكسفورد الرقمية بدأت عملياتها كوحدة جديدة من خدمات المكتبة الجامعية في تموز من عام 2001.
المكتبات المرتبطة بنظام OLIS
ترتبط في نظام OLIS أكثر من 100 مكتبة متنوعة، هناك نوعين من المكتبات:
§ النوع الأول: المكتبات التابعة لجامعة أكسفورد من كليات أو مؤسسات بحثية.
§ النوع الثاني: المكتبات الخاصة، غالبيتها مكتبات بحثية وملحقة بكليات وأقسام ومؤسسات الجامعة ومكتبات الكليات وهي تشترك مع المكتبة في نظام فهرسها الآلي.
نظام معلومات مكتبات أكسفورد:
نظام معلومات مكتبات أكسفورد OLIS نظام مكتبي متطور، أعد من قبل شركة GEAC وذلك عام 1996 يرى المستفيد منه قاعدة بيانات لموجودات المكتبة ضمن الفهرس الآلي لها، بينما نراه في الجانب الآخر نظام موحد ومعقد لموظفي المكتبة يستخدمونه في طلب الكتب والدوريات وتسجيل المواد الواردة إلى المكتبة وفي تسجيل إصدارات الدورية الجديدة، كما يستخدم في إعارة الوثائق والمطبوعات، وتوفير حجز الكتب للباحثين والطلاب، فضلا عن إرسال إشعارات إلى المستعيرين حول إعادة الكتب أو تجديد إعارتها وكذلك إشعارات إلى الناشرين حول قوائم الشراء والحصول على مطبوعات جديدة.
يضم نظام OLIS أكثر من 5 ملايين عنوان لما يقدر من موجودات بحوالي 10 ملايين عنوان ضمن مقتنيات المكتبات التابعة لجامعة أكسفورد من كليات و أقسام أو من خلال المكتبات المشتركة معها.
إن أغلب محتويات نظام OLIS هو الكتب والدوريات، أما فيما يتعلق بالتغطية للمواد الأخرى مثل الخرائط والقطع الموسيقية والمخطوطات والمطبوعات الحكومية فإنها أقل شمولا.
الخدمات التي تقدمها جامعة أكسفورد:
تقدم مكتبة أكسفورد الرقمية سلسلة من الخدمات لدعم إنشاء مصادر رقمية من خلال محتويات خدمات المكتبة الجامعية وهي:
§ الصور الرقمية: إذ توفر سلسلة كاملة من الصور الثانية ( الأبيض والأسود والملون )
§ النصائح والاستشارات: وتشمل الإدارة ومخطط العمل والإنتاج الفكري والمحددات والتكاليف.
§ التعاون مع OULS خدمات مكتبات جامعة أكسفورد وOUCS الخدمات الآلية لجامعة أكسفورد من حيث الخزن والمكننة الأرشيفية.
§ الارتباط بمصادر ملائمة لتطوير المكتبة الرقمية ومستودعاتها.
Selecting Research Collections for Digitization-Full Report
Selecting Research Collections for Digitization
by Dan Hazen, Jeffrey Horrell, Jan Merrill-Oldham
August 1998
August 1998
Contents
Foreword
Summary
Authors' Acknowledgments
Introduction
Copyright: The Place to Begin
The Intellectual Nature of the Source Materials
Current and Potential Users
Actual and Anticipated Nature of Use
The Format and Nature of the Digital Product
Describing, Delivering, and Retaining the Digital Product
Relationships to Other Digital Efforts
Costs and Benefits
Conclusion
Selection for Digitizing: A Decision-Making Matrix
About the Authors
About the Commission on Preservation and Access
Digital Libraries
Summary
Authors' Acknowledgments
Introduction
Copyright: The Place to Begin
The Intellectual Nature of the Source Materials
Current and Potential Users
Actual and Anticipated Nature of Use
The Format and Nature of the Digital Product
Describing, Delivering, and Retaining the Digital Product
Relationships to Other Digital Efforts
Costs and Benefits
Conclusion
Selection for Digitizing: A Decision-Making Matrix
About the Authors
About the Commission on Preservation and Access
Digital Libraries
Foreword
Collection building in the digital era presents challenges that libraries and archives have never before faced. They vary from having to work within licensing agreements in order to acquire serial publications, to having new, not yet well-defined options for providing service of analog items through digital conversion and dissemination. What role does the digitization of research collections play in a library's efforts to provide resources to its patrons when, where, and how they prefer to use them?
This paper proposes a model of the decision-making process required of research libraries when they embark on digital conversion projects. It is one of a series by CLIR dedicated to selection policy questions that have arisen in the digital information environment. The authors of the paper offer a series of questions to be answered that will facilitate the decision-making process for library managers. They place the questions of what and how to digitize into the larger framework of collection building by focusing, first, on the nature of the collections and their use, and, second, on the realities of the institutional context in which these decisions are made. Their method is, above all, most helpful in its pragmatic approach to the unsettling dynamism of the digital technology itself. They view technology as a tool to serve specific collections-related goals and assess the available technology for its ability to aid or obstruct access and preservation.
Summary
Selection for digitization is a complicated process having much in common with selection for purchase, microfilming, and withdrawal, and with other strategic decision-making that is integral to the work of libraries. The conversion of textual, visual, and numeric information to electronic form—from preparation and conversion to presentation and archiving—encompasses a range of procedures and technologies with widely varying implications and costs. The judgments we must make in defining digital projects involve the following factors: the intellectual and physical nature of the source materials; the number and location of current and potential users; the current and potential nature of use; the format and nature of the proposed digital product and how it will be described, delivered, and archived; how the proposed product relates to other digitization efforts; and projections of costs in relation to benefits.
Copyright assessments play a defining role in digitization projects and must be addressed early in the selection process. If a proposed digitizing project involves materials that are not in the public domain, permissions must be secured and appropriate fees paid. If permissions are not forthcoming, the materials cannot be reproduced and the focus of the project must change. We will be able to convert to electronic form only a small percentage of existing scholarly materials, and to do even that will require substantial investments. Therefore, the intellectual value of the original sources, together with the types and levels of use, must shape priorities for conversion. Ideally, the electronic version of a source will permit new kinds of use and more sophisticated types of analysis. Decisions to digitize must also take into account the physical size, nature, and condition of source materials as they affect the characteristics of the desired product. Decisions must be based on the current state of technology, but they must also anticipate how changes in technology could enhance or make obsolete an investment in digitization. One must also assess how the product will be described for users, delivered to them, and managed over time.
Digitization, like other reformatting endeavors, takes place within a context larger than a single institution, discipline, or country. Selection decisions should be informed by both duplicative and complementary efforts. This may prove challenging, because it is difficult to determine whether an item has been already digitized and by what means. Cost-benefit analysis for digital conversion may also be hard to conduct reliably, because the costs of creating electronic resources vary considerably. File size, associated storage needs, and processing requirements account for part of the differences, though labor requirements are even more important. Functions such as preparation of materials for scanning, indexing, bibliographic description, post-scan processing, and long-term file management often fail to be factored into cost equations. Incomplete cost analyses can impute benefits that are difficult to represent on a project balance sheet. Though digitizing projects must calculate the likely costs and benefits, our ability to predict either of them is as yet rudimentary. Thus, the decision to digitize must begin with an inquiry into copyright and an assessment of the nature and importance of the original source materials, but it must then proceed to analyze the nature and quality of the digitizing process itself—how well relevant information is captured from the original, and then how the digital data are organized, indexed, delivered to users, and maintained over time.
Authors' Acknowledgments
This essay grew out of the work of a Harvard University Library task force appointed late in 1995 and charged with drafting a broadbased white paper to help Harvard's librarians and curators plan digital projects. Rapid developments in digitizing and processing technologies, file naming and metadata creation, interpretation of copyrights and management of permissions, archiving, and other technical and administrative issues resulted in the emergence of "selection" as the topic that could be most effectively addressed at this time.
The essay owes much to Barbara Graham, Associate Director for Administration and Programs in the Harvard University Library, who convened the task force. Special thanks are due to colleagues Stephen Chapman, Preservation Librarian for Digital Initiatives, Lee Anne George, formerly Librarian for Information and Document Delivery Services in the Harvard College Library and now Program Planning Officer at the Association for Research Libraries, and Robin McElheny, Associate Archivist for Programs in the Harvard University Archives, who were members of the task force and made helpful comments on successive drafts. Stephen also collaborated on development of the accompanying flow chart.
Introduction
Electronic resources are immensely appealing to nearly everyone concerned with education and scholarship. The potential benefits of information in digital form—unfettered access, flexibility, enhanced capabilities for analysis and manipulation—are profound. The widely held notion that existing collections of books, manuscripts, photographs, and other materials should (and will) be digitized wholesale is not surprising. In reality, of course, the creation and maintenance of electronic resources require funding, skill, and ongoing commitment. Those that are intended for permanent use, moreover, will almost certainly require repeated intervention to ensure that they remain viable as technologies evolve. In creating digital products, libraries are called upon to balance the competing worlds of boundless promise and limited resources. Because hard choices are unavoidable, the decision-making process must be well organized and its results fully consonant with the institution's goals and values.
Selection for digitization is a complicated process having much in common with selection for purchase, microfilming, and withdrawal and with other strategic decision-making that is integral to the work of librarians and curators. Conversion of textual, visual, and numeric information to electronic form, however, involves additional layers of complexity. The digitization process, from preparation and conversion to presentation and archiving, encompasses a range of procedures and technologies with widely varying implications and costs. Digital reformatting of library collections is still in its infancy, at once limiting what can be accomplished now and forcing decision-makers to anticipate future improvements. Scanned images optimized for viewing on today's computer monitors, for example, will display poorly on tomorrow's high-resolution screens and will require reprocessing. The same may ultimately be true of bitmap texts, which, if they are not made word-searchable once conversion is affordable, may be underutilized by researchers who have come to rely on key-word search capability. Considerations such as these make selection for digitizing more challenging than selection for purchase.
The judgments we must make in defining digital projects require consideration of many factors, including: assessment of the intellectual and physical nature of the source materials; the number and location of current and potential users; the current and potential nature of use; the format and nature of the proposed digital product and how it will be described, delivered, and archived; how the proposed product relates to other digitization efforts; and projections of costs in relation to benefits.
Copyright: The Place to Begin
There are many interdependent and interacting factors to be weighed in selecting materials to digitize. The specific choices that result from the selection process will reflect subjective judgments, any of which may change over time. Nuanced assessments, ambiguity, and shades of gray are all to be expected.
Questions concerning copyright, however, are far more clear-cut. Simply stated, if a proposed digitizing project involves materials in the public domain, the work can proceed. If the source materials are protected by copyright but rights are held by the institution or appropriate permissions can be secured, the work can move ahead. If permissions are not forthcoming for copyrighted sources, however, the materials cannot be reproduced and the focus of the project must change. Copyright assessments thus play a defining role with regard to digitizing projects. Since the impact of copyright is so decisive, we have given it pride of place in this discussion.
Copyright issues in the digital environment are still very much in flux and have provoked ongoing international discussion. While the broad thrust of digital technology is toward enhanced access, diminished costs, and more versatile capabilities, it is far less clear that copyright law will likewise encourage wider use. The legal strictures applicable to a particular project will vary depending on the country in which the project is based, the country in which the source materials were produced, and prevailing international agreements. Different kinds of materials, moreover, usually pose different types of rights-management issues. The performance rights associated with musical scores, for example, or exhibition rights for films, differ from rights for nonperformance materials such as electronic journals or documentary photographs. To complicate matters, all these rights are susceptible to change over time.
Digital projects must be undertaken with a full understanding of ownership rights, difficult as they often are to ascertain, and with full recognition that permissions are essential to convert materials that are not in the public domain. Rights that must be negotiated with the copyright holder often entail fees. The institution hosting a project may also have policies and procedures that inform intellectual property negotiations. The general counsel or legal office of most institutions can provide guidance. The Internet site IFLA: Copyright and Intellectual Property Resources (see ) is a good resource for maintaining current awareness. It includes articles, reports and white papers, discussions, and information about organizations related to copyright issues, intellectual property in general, and electronic distribution of intellectual property.
The Intellectual Nature of the Source Materials
The following sections of this paper separately discuss the complement of considerations that bear on decisions to digitize. The elements are presented in a sequence that moves from relatively abstract assessments of intellectual value to nuts-and-bolts issues concerning whether available resources and technology can provide a product that meets expectations. In practice, the pieces interact in ways that are often complex.
Decisions about what to digitize must first and foremost address the intellectual value of the original sources. We are likely to be able to convert only a small percentage of existing scholarly materials to electronic form, and doing even this will require substantial investments. We therefore need to determine what it is truly worthwhile to convert.
Questions to Ask
Does the intellectual quality of the source material warrant the level of access made possible by digitizing?
Materials with marginal scholarly value are best left in their original form or made accessible in a less costly manner. Scholarly value, of course, is a subjective assessment and even the most marginal materials can support some kinds of research. Most users, nonetheless, would opt for electronic access to original monographs rather than to derivative works, or to the papers of a prominent scholar over the administrative records of a university department. Bibliographers regularly make purchase decisions that reflect their evaluation of the intellectual quality of single items or collections of materials. Similar judgments apply in choosing what to digitize.
Will digitization enhance the intellectual value of the material?
Scholarship can be facilitated when texts are made fully searchable by rekeying (retyping) them or by employing OCR software. Comparisons between successive drafts of a text and the final published work, for example, or with later editions and translations, are vastly simplified when the words and phrases are searchable. A concordance or thesaurus is likewise most easily mined when it is in searchable form. Electronic texts can be moved readily from one environment to another (from the World Wide Web onto the hard drive of a personal computer, and then into a word processing program, for example), shared with other users, and manipulated and reconfigured for multiple purposes. Digitized prints, drawings, and other visual resources can be viewed in groups at low resolution or inspected individually for very fine detail. Digital charts and tables, appropriately coded, can be loaded directly into statistical software packages for additional analysis. Census results, for instance, are most easily used when the data have been formatted and imported into the Statistical Package for the Social Sciences.
Will electronic access to a body of information add significantly to its potential to enlighten, or are the original books, manuscripts, photographs, or paintings sufficient to the task?
A collection of thousands of portrait images, however promising a resource, might be nearly unapproachable because of its size and the condition and dimensions of individual items. Well-indexed and in digitized form, however, the collection could be searched with relative ease for images of a particular person or for some indexed characteristic (the country from which the portrait originates, for example). Likewise, the digitization of large-format architectural drawings could enable comparisons of small- and large-scale drawings, different views of the same architectural feature, or sequential phases of construction.
To what extent will the combination or aggregation of original sources increase their value?
Digitizing related scholarly monographs, like building a coherent collection of paper copies, can strengthen the context within which each title is approached. Ephemera—leaflets from a political campaign, for example—are often most useful when studied in the aggregate, as are posters, broadsides, and popular literature. Harvard has digitized daguerreotypes from thirteen repositories to facilitate the combinations and comparisons that are otherwise precluded by the fragility, value, and dispersion of the original images.
Current and Potential Users
Some scholarly resources are heavily used; others are consulted infrequently. With only limited funds available for reformatting, types and levels of use can help to shape priorities.
Questions to Ask
Are scholars now consulting the proposed source materials? Are the materials being used as much as they might be?
These are complicated questions. Intensive use does not automatically make a collection a good candidate for digitizing. If the primary audience is local, for example, and if competition for a particular resource is not a problem, access may already be sufficient. Ephemera produced by a community political organization may be of great interest to local scholars and of limited value to a worldwide audience. On the other hand, if use is heavy and widespread, digitizing may at once guarantee convenient and reliable access, and make it possible for some institutions to discard their original copies. The JSTOR project (see ), through which a large array of core scholarly journals is being made accessible in digital form, is a prime example of an initiative focusing on high-use materials.
Is current access to the proposed materials so difficult that digitization will create a new audience?
Low use may signal that a collection has marginal intellectual value, but there are many other reasons for valuable materials to have generated little interest. A collection may be held in a remote location, for example, or be owned by an institution with highly restrictive access policies. Bibliographic records may be poor, as is often the case with pamphlets. The value of digitizing such materials may go beyond the simple fact that the resulting files can be widely distributed. Broader access, as it creates a new community of users, can also facilitate more active scholarship.
Does the physical condition of the original materials limit their use?
Some resources are too fragile to be consulted. Aging newspapers or palm-leaf manuscripts that break at the slightest flex simply cannot be browsed. In such cases, a digital copy might be provided to improve access, and a microfilm or other photographic surrogate made to ensure long-term survival. (Film can be made from a digital file or vice versa.)
Sources may also be at risk because of high user demand or extraordinary monetary value. A nation's founding documents, glass-plate negatives of vanished architectural sites, or rare maps may benefit from the creation of digital copies that satisfy the purposes of most users. These files do not necessarily need to meet archival standards. They are created to protect the originals from handling.
Are related materials so widely dispersed that they cannot be studied in context?
Cooperative efforts to digitize disparate pieces of a greater whole can create or restore a more usable collection. Papyrus fragments, a prominent individual's far-flung correspondence, scattered photographs of a particular subject or by a specific photographer, and broken serial runs are among the many materials whose coherence, accessibility, and scholarly utility can be enhanced through digitization.
Will the proposed digital files be of manageable size and format?
Digital resources need to match users' technical capabilities and equipment. Most require Internet access and standard web browsers, or a CD-ROM drive. Images delivered to the Internet in formats other than JPEG or GIF require additional software for viewing or printing. Even when electronic resources are optimized for on-screen delivery, some network connections, particularly those via modem, are still far too slow to support browsing of digital collections at satisfactory speeds. And scholars in some locations may lack training opportunities or the ongoing technical support needed to take advantage of the electronic environment. These limitations, however, are not necessarily reasons to rule out digitizing. The worldwide trend is toward greater capabilities. Moreover, the more important the resources available electronically, the greater the incentive to acquire the network, viewing, and printing technology necessary to use those resources. Digitization may, in and of itself, stimulate improved access.
Will digitization address the needs of local students and scholars?
Immediate demand can inject a measure of practical reality into decisions to create electronic resources. An art historian might seek to scan art images and make them available to students as electronic reserves, as an alternative to slide-based classroom presentations and reviews. A historian may choose to teach from digitized images of manuscripts that would otherwise be unavailable to a large class. Because ready access to shared electronic files can transform the classroom, proposals to digitize in support of immediate teaching needs may garner faculty support.
Actual and Anticipated Nature of Use
A person reading a book, looking at a photograph, or consulting a manuscript encounters few barriers to use. One might have to handle an object carefully, or use a magnifying glass to read fine print, but in general the work is immediately approachable. The same resource, when digitized, should be equally accessible and approachable. Ideally, the electronic version will also permit new kinds of use and more sophisticated types of analysis.
Questions to Ask
How do scholars use the existing source materials? What approach to digitization will facilitate their work?
Different digitizing techniques result in electronic files with different characteristics. These in turn can correspond well or poorly with scholarly needs. If the goal is to provide an image-based finding aid that helps users identify original materials of interest, for example, mounting slow-loading high-resolution images would be counterproductive. If, on the other hand, the intention is to reduce or eliminate handling of original materials, an image that fails to convey all critical information embodied in the original will fail to serve its intended purpose.
The simplest approach to digitizing involves use of a scanner or digital camera to create electronic pictures (bitmap images) of original materials. Decisions concerning the number of dots recorded by the scanner (resolution), how many shades of gray or colors will be recorded (bit depth), and other factors related to scanning equipment and settings will determine how well the digital product replicates the original. High-quality bitmap images can usually capture all the significant detail in texts or graphics. Scanning rare and unique texts or visual resources can make them accessible to users who would otherwise never see them. In such a case, merely reproducing the original in electronic form represents an extraordinary enhancement.
For textual materials, post-scan processing can support expanded capabilities. Scanned text can be processed with Optical Character Recognition software to produce searchable indexes. OCR software is now only occasionally employed in digitizing projects because it cannot yet interpret accurately all fonts and alphabets, and because it adds significantly to per-page costs. Text can also be rekeyed to create ASCII files (very straightforward digital text files that permit searching by keywords or phrases). In some cases this enhancement is the primary justification for digitization. Directories, dictionaries, and indexes are all significantly easier to use when specific words can be searched within a well-designed digital file.
ASCII texts accommodate key-word searching (e.g., searching for all instances of the word "temperance") and some kinds of analysis, but they do not readily replicate the structure and format of an original document. Without special coding, researchers cannot directly consult the seventh paragraph of the third chapter of a particular text. Nor can they search for all occurrences of "welcome" used as a verb rather than a noun. These capabilities become possible in marked-up texts, which are coded to highlight elements of structure, format, and syntax. The Standard Generalized Markup Language (SGML) is the emerging model. One SGML application, the Encoded Archival Description (EAD), is being used to create electronic versions of archival finding aids.
These and other approaches to digitizing carry very different costs, benefits, and resource requirements. While electronic versions can be more versatile than original materials, in some cases they hinder research. A scholar studying bookbindings or papermaking, for example, is poorly served by a reproduction of any kind. So too is the scholar whose immediate access to a large and important collection of literary works is sacrificed in order to serve a worldwide constituency—perhaps because bound volumes have been disbound for scanning.
Will digitization increase the utility of the source materials? Will it enable new kinds of teaching or research? Do scholars agree that the proposed product will be useful?
Digitization can enhance original materials in many ways. Image quality can be improved by eliminating extraneous stains and marks. Thumbnail images of visual resources (photographs, drawings, paintings) can be browsed to discover patterns, trends, and relationships among individual items, and specific images can then be scrutinized at higher resolution. Likewise, patrons can review scanned images to identify needed materials before requesting that they be retrieved from storage.
Electronic transcriptions of texts, in ASCII format or marked-up files, can be linked to bitmap images of original documents. Readers can then decide for themselves whether "authoritative" transcriptions are in fact accurate. Comparisons of different versions of a text are likewise simplified. Related texts and images can be assembled together within a single, unified corpus. Examples such as the Dante Project mounted by Dartmouth College (see ), which reproduces and links related texts and commentaries concerning the Divine Comedy, and Tufts University's Perseus Project (see ), an interactive, multimedia database on Archaic and Classical Greece, suggest the potential of electronic texts.
Almost all electronic products will provide basic links that allow users to navigate them (to locate a particular map within a printed text, for example). The degree to which a digitization project exploits electronic links will depend upon its intended use. For digital resources created as pedagogical tools, predetermined connections are part of the package. Products intended for research tend to be less aggressive in ordaining relationships among sources, since their creators assume that researchers will build their own structures of meaning.
Are there other scholars, librarians, and archivists who can collaborate to create a useful product?
Colleagues and potential users can clarify ideas, help select meaningful materials for conversion, improve project design, and stimulate early interest. "User demand" reflects both the intrinsic utility of specific source materials as well as a social context of participation and promotion.
The Format and Nature of the Digital Product
Decisions to digitize must take into account the physical size, nature, and condition of source materials as they affect the characteristics of the desired product. They must likewise address whether available means of conversion can satisfy expectations for the result. Projects must also, from the very first, consider how users will be guided through the electronic version.
Questions to Ask
What critical features of the source material must be captured in the digital product? Are very high resolution copies, accurate rendition of colors, a seamless combination of images and text, or other qualities considered essential?
The cost and nature of digitizing hardware and software continue to evolve, and preferred solutions are likely to shift as well. It may sometimes make sense to defer certain digitizing projects so that technology can catch up to needs. The success of a project to digitize oversized maps at Columbia University, for example, depended partly on the ability of users to see detail and read place names. As a result, the maps were scanned at relatively high resolution, thereby creating challenges for digital image delivery and presentation. File sizes were very large and initially outran the capacity of the library's computers and network. Greater bandwidth and more powerful machines have enhanced functionality.
If the original sources are to be retained, can they withstand the digitization process?
Automatic sheet feeders are fast and efficient, but they may destroy brittle paper. Digital cameras can minimize the manipulation of source materials, but subjecting certain media—watercolors, for example—to prolonged lighting is problematic.
What type of hardware should be used for conversion?
Color slides, for instance, cannot be fully represented by scanners that create only black-and-white images. Even a color scanner with limited capacity to reproduce tonalities will be inadequate when high-quality images are important. Digitizing equipment can be expensive, and the costs may be difficult to justify when use is sporadic. Some projects may thus be done most economically if they are contracted out. Agreements with external vendors, in addition to specifying technical conditions, performance expectations, and handling guidelines, must fully define ownership and distribution rights for all digital products.
Will a digitized sample meet users' needs? If so, how should the sample be constructed?
Many collections are too large to convert in their entirety. In the case of an artist's drawings, one might select materials from each of the artist's major periods, or representatives of the various media in which he or she worked, or particular subjects, such as cityscapes or portraits. Subsets of large collections can be defined in many ways and for many purposes. Collaboration with scholars and other experts is essential.
Will the information resources upon which the project is based continue to grow?
Ongoing commitments and extended arrangements for copyrights may be required when collections are still expanding, as is the case with current journals and annual reports, or the papers of a living individual. Consultations with scholars and other experts can be particularly useful, since the long-term value of current materials is often difficult to discern.
How will users navigate within and among digital collections?
Printed sources orient readers by means of tables of contents, chapters and sections, pagination, indexing, and formatting cues. Manuscript materials often rely on finding aids linked to the organization of file folders. Photographs may be mounted in albums. At a minimum, electronic products need to provide the same kind of functionality. The process may require several steps. For a multi-volume work that has been scanned page by page, for instance, each page is a separate computer file that must be individually labeled and stored. The files for critical pages of the work—for example, the title page, table of contents, and the first page of every new chapter—must then be linked to electronic navigational tools so that they can be easily located.
Describing, Delivering, and Retaining the Digital Product
While libraries can point with pride to their collective achievements in organizing and describing an enormous number and variety of collections and material types, some perplexing issues have not yet been resolved. There is still no consensus on how to handle ephemera that cannot realistically be cataloged by the piece and that are too insubstantial to shelve like most books and journals. Providing access to mixed media (a book accompanied by a floppy disk or CD-ROM, for example) is likewise problematic. But these issues, complicated as they are, pale next to the challenges of making digital products available to users. Decisions as to what resources should be digitized must be informed by an understanding of how the product will be described for users, delivered to them, and managed over time.
Questions to Ask
How will users know that the digital file exists?
Bibliographic records, finding aids, and indexes can all be adapted to include references to electronic resources. Nonetheless, our ability to determine what has been digitized remains well behind what we know about materials that have been microfilmed or photocopied.
One of the principal challenges is to determine what information is essential in describing an electronic product. The "Dublin Core" (seehttp://purl.oclc.org/metadata/dublin_core/) and other special initiatives for structuring and standardizing descriptive data propose to combine information about the technical characteristics of digital files (how they were created), their location, and a summary of their contents. The resulting records are known as "metadata." Their function is to provide users with a standardized means for intellectual access to digitized materials. Despite these and other initiatives, projects to catalog digital files are only in the developmental stage. No system has yet been widely adopted for tracking the digitizing activities of libraries, archives, and museums, although new approaches continue to emerge.
How can the digital product best be delivered to users?
Alternative modes of digital storage and delivery must be considered from the outset of a project. CD-ROMs, for instance, are distributed and used differently from information made accessible over the Internet. The differences are reflected in hardware requirements, software, and ease of use. CD-ROMs are sometimes bundled with software for searching and analysis that is superior to that generally provided for Internet files. On the other hand, access to CD-ROMs is limited to individual workstations or small networks, while Internet files can be made available to a very broad audience. And Internet resources, by nature, can be updated or augmented without requiring users to replace objects that have become obsolete.
Internet products, however, generate questions of their own. How immediate must access be? Files can be mounted on a server so that they are instantaneously available on-line. They can be stored on disks in a jukebox and loaded on demand ("near-line" access), or kept off-site ("off-line") and retrieved and delivered on demand. Near-line and off-line access can save on server space and requirements, though there are countervailing staff costs associated with retrieving and mounting the files. Expected demand, file sizes, fee structures, and available staffing and equipment must all be considered.
Who will be authorized to use the digital resource, and under what circumstances?
Copyright holders may limit distribution rights, institutions may be unable or unwilling to provide the infrastructure needed to support universal access, and cost-recovery enterprises cannot by definition make their products available without restriction. Digitizing projects must thus consider access policies and control, pricing mechanisms, and billing procedures. Access issues impinge upon selection decisions in a number of ways. A university may mount high-resolution images of unique holdings for scholarly use (a medieval manuscript, an important collection of drawings), but would not allow unauthorized publication of those images. Moreover, electronic resources cost money that must be secured through subsidies or fees. When neither internal budgets nor external subventions provide adequate financial support, digitization will require a paying audience.
Access, when it is not universal, must be managed. Current alternatives include passwords, direct user fees, and limitations according to organizational affiliation. Different capabilities for viewing, downloading, and printing may be offered at different prices or to different sets of users. There are many options, each reflecting a different pathway toward a self-sustaining endeavor.
How will the integrity of the digitized data be ensured?
The malleability of electronic products makes them particularly useful for many kinds of scholarship. Digitized files must be embedded with detailed information concerning the methods used to create them. The same information should be included in external bibliographic or descriptive records. Users who are consulting or copying the sources must also be able to confirm that the files they see or receive match the originals. Means to authenticate and protect digital products, long available in financial and industrial applications, are only beginning to take hold in the scholarly world.
Particularly for digital products created to meet local demand, is the existing technology infrastructure adequate?
Robust computer systems and an appropriate number of work stations are perhaps more easily provided than such ancillary features as network printing capabilities in the library and in offices, classrooms, and residences.
What are the long-term intentions for the digital file?
In the case of electronic document delivery systems such as ARIEL (a product of the Research Libraries Group, Inc.), the goal in most cases is to provide very rapid access to specific articles or chapters. While images must be legible, they need not be perfect replicas; and copyright constraints, indexing complexities, and storage economies make it simpler to rescan on demand than to organize and retain random files. In other cases, the file may be kept for a longer, but still limited, period and then discarded—a reserve reading list or copyrighted images of artworks scanned to support classroom teaching, for example.
Is the long-term preservation of deteriorated materials a project goal?
Preserving documentary resources in electronic format presumes that, to the greatest extent possible, all the information contained in the original material has been captured completely and accurately. This requires careful attention to significant detail, whether the smallest text character on a page or all the shades and tones of blue and green in a seascape. Targets for resolution, grayscale, and rendition of color either exist or are being developed to ensure the needed detail and fidelity.
Digital preservation also requires a supporting organization and infrastructure dedicated to storing the electronic files and to migrating them to new formats and/or media as technologies change. Unless these capacities are all in place, digital files cannot be regarded as permanent. Creating an enduring digital preservation master file is a multidimensional task with long-term implications. Hybrid projects, in which digital files are complemented by copies on microfilm, alkaline paper, or some other stable medium, provide the insurance that exclusively electronic projects do not.
Digital processes meet preservation objectives without pretending to permanence. In the case of Spain's Archivo de Indias, for instance, low-resolution grayscale images were prepared so that fragile original documents, some more than five hundred years old, could be spared the rigors of repeated consultation. The digital files, while they fall well short of capturing all the information in the originals, nonetheless fulfill a vital preservation function.
Relationships to Other Digital Efforts
Digitization, like other reformatting endeavors, takes place within a context larger than a single institution, discipline, or country. Selection decisions should be informed by both duplicative and complementary efforts.
Questions to Ask
Have the materials proposed for digitization already been converted to electronic form?
As we have seen, it can be difficult to determine whether a specific item has been digitized and by what means. If an electronic copy does exist, is it accurate, satisfactorily functional, and accessible? Does it take advantage of the capabilities of current technologies? If the existing product does not serve the intended purposes of the proposed project, a new version may be warranted.
Can cooperative digitization efforts bring together a cohesive body of material that would otherwise remain disassociated?
Standardized descriptors and a common approach to indexing and storage can allow dispersed materials to be combined in an amalgamated digital resource. The process involves institutional alliances as well as technological conventions. Different levels of participation and different expectations for returns may affect the result. If one institution provides the majority of materials for a digital project, for example, with many others completing the whole, the "lead" institution may claim special consideration or returns, requiring extra negotiation.
Successful projects to combine digital resources through a common system for organization and delivery suggest a new kind of model for collection building. Even in preservation microfilming, cooperative efforts to preserve a single title typically involve assembling dispersed materials at a central location for filming, or bringing together film prepared at various locations for splicing and duplication. The workflow of digital collection development can remain radically decentralized provided a robust infrastructure for collaboration is in place. The Research Libraries Group project, Studies in Scarlet: Marriage, Women, and the Law, 1815-1914, is a case in point (seehttp://www.rlg.org/scarlet/sis.html). Six U.S. libraries and one in Great Britain have scanned trial accounts, case law, statutes, treatises, and other materials related to the theme expressed in the project title. RLG established file naming conventions and other guidelines, designed the interface, and will serve the images—one of several models being explored for the creation of virtual collections. The conceptual kinship with traditional collection development is clear.
Costs and Benefits
Cost-benefit analysis assesses the relationship between functionality, demand, and expense. Limited resources and competing demands on organizational time and energy mean that the analysis must be rigorous and complete. The costs of creating electronic resources vary considerably. File size (and the associated storage needs) and processing requirements account for part of the differences, though labor requirements are even more important. Bitmap images in black and white are relatively inexpensive to produce and store. Grayscale images, currently capable of capturing up to 254 shades of gray plus black and white, are more costly; color images are the most costly of all. In each case, images with higher resolution result in larger digital files.
Accurate ASCII files of searchable text, even though occupying far less computer memory than any image file, are more expensive to produce than bitmaps of the same material. The main reason is that OCR software is not yet fully reliable. Materials converted by machine must be painstakingly proofread, or the source documents must be rekeyed in combination with careful attention to the detection and correction of errors. Costs rise even more for marked-up text, which entails yet another level of analysis and intervention. Creating other kinds of special databases or enhanced capabilities, for image files or for text, likewise raises the costs.
Costs vary even within specific approaches to digitization. All other things being equal, for example, it is less expensive to scan from single sheets than from bound volumes. Small sheets are less expensive to scan than oversized ones. Items in good condition are less costly to process than those that are deteriorated and thus require special handling.
Available cost figures for digitizing projects are often misleading. Cost projections seek to pin down a rapidly moving target. Although the prices of computer storage and processing power, for example, continue to fall, most projections simply extrapolate from available information about current price structures. Analyses often fail to account for certain categories of effort that, were they included, would alter cost calculations significantly. Labor expenses, for instance, often reflect only a pro-rated price per page that overlooks the real cost of a full-time employee. Crucial pieces of the workflow are sometimes written off as one-time "research and development" expenses. Functions such as preparation of materials for scanning, indexing, bibliographic description, post-scan processing, and long-term file management may not be factored into cost equations. Incomplete cost analyses can impute benefits that are difficult to represent on a project balance sheet. It may be true, for example, that ready access to backfiles of digitized journals will ultimately reduce or eliminate construction costs for new stack space. Unfortunately, money not spent on capital projects is unlikely to be reflected in support for other library initiatives. Though digitizing projects must calculate the likely costs and benefits, our ability to predict either of them is as yet rudimentary.
Questions to Ask
Who will benefit from the proposed digital product?
It is important to consider whether the product will support better teaching or research and enable students to learn more, or in different ways—if, for example, texts or images are more fully revealed. Digitization may allow librarians to manage collections and provide services more effectively, or to provide traditional services such as copying or interlibrary loan at lower cost or at less risk to collections.
Is the intellectual value of the proposed product commensurate with the expense?
The limited resources available for digitization might have greater impact if they were directed at another project, or directed toward an entirely different approach to providing access—through exhaustive indexing perhaps, or microfilming, or some other type of reformatting that would prove in the end more useful to scholars.
Could an acceptable product be created at lower cost?
When materials are scanned to support short-term course work, for example, careful (and expensive) post-scan processing to eliminate extraneous marks and speckles or to deskew misaligned images may be a waste of time. Likewise, an adequate substitute for full-text scanning of little-used journals might be provided by linking scanned tables of contents and indexes to bibliographic records and relying on traditional forms of document delivery.
How will the proposed project address the long-term costs associated with digital files?
The accumulated body of digital products may enable savings elsewhere in the institution—for example, by reducing staff costs for reshelving bound journals, or by lowering the costs of storage, circulation, and preservation—and these savings could offset some or all of the expense of digitizing. But such savings as may be realized are difficult to predict. It is essential to realize that the costs of digitization are just beginning at the time of initial capture. The programmatic capacity to distribute and maintain electronic resources, and to migrate them to new forms as original digital platforms fail and formats and software are superseded, is fundamental to long-term efforts. In addition, there are staff costs associated with training and user support. Finally, rising user expectations may require that existing digital files be reprocessed in new ways. When OCR software is perfected, for example, unsearchable bitmap images of texts could be thought unsatisfactory. Projects that do not plan for change may become obsolete, and therefore irrelevant.
Can external funding be secured to support the proposed project?
Some foundations are particularly interested in electronic products, and specialized scholarly initiatives may attract their support.
Conclusion
Research libraries are eagerly embracing the digital world. They are acquiring access to great quantities of electronic materials produced outside their walls and are making digital versions of their own holdings. These projects, as they become more common, are bringing both the broad issues and the nuances of the digitizing process into sharper relief.
Projects based on careful review, analysis, and planning can yield electronic resources that are functional and faithful to the original sources, and that support new kinds of scholarship. A detailed plan of work, regular assessment of progress, closely documented adjustments and corrections, and the retention of other project-related data can strengthen the knowledge base for future efforts. Each success, as well as each failure, will bring us closer to fulfilling the promises of the electronic environment.
The process of deciding what to digitize anticipates all the major stages of project implementation. Digital resources depend on the nature and importance of the original source materials, but also on the nature and quality of the digitizing process itself—on how well relevant information is captured from the original, and then on how the digital data are organized, indexed, delivered to users, and maintained over time. Disciplined efforts to address the themes and questions outlined in this essay will help ensure that new digitizing projects fulfill the expectations of libraries, students, and scholars.
About the Authors
Dan Hazen, Librarian for Latin America, Spain, and Portugal at the Harvard College Library, is an area specialist actively involved in preservation microfilming and digital conversion projects both in America and abroad. Jeffrey Horrell, Associate Librarian of Harvard College for Collections, has served in library positions at the University of Michigan, Dartmouth College, and Syracuse University; he has also pursued research in the history of photography. Jan Merrill-Oldham, Malloy-Rabinowitz Preservation Librarian, directs the work of the Harvard University Library Preservation Center and the Harvard College Library Preservation Services Department, where appropriate means of integrating digital capabilities with established preservation and access strategies are being sought.
Commission on Preservation and Access
The Commission on Preservation and Access, a program of the Council on Library and Information Resources, supports the efforts of libraries and archives to save endangered portions of their paper-based collections and to meet the new preservation challenges of the digital environment. Working with institutions around the world, the Commission disseminates knowledge of best preservation practices and promotes a coordinated approach to preservation activity.
Digital Libraries
The Digital Libraries program of the Council on Library and Information Resources is committed to helping libraries of all types and sizes understand the far-reaching implications of digitization. To that end, CLIR supports projects and publications whose purpose is to build confidence in, and increase understanding of, the digital component that libraries are now adding to their traditional print holdings.
مكتبة رقمية
من ويكيبيديا، الموسوعة الحرة
المكتبات الرقمية | |
أنواع | |
---|---|
| |
عنوان رأسي | |
| |
المكتبة الرقمية أو المكتبة الإلكترونية هي مجموعة من المواد (نصوص وصور وفيديو وغيرها) مخزنة بصيغة رقمية ويمكن الوصول إليها عبر عدة وسائط. أهم وسائل الوصول لمحتويات المكتبة الرقمية هي الشبكات الحاسوبية وبصفة خاصة الإنترنت.
لا ينحصر محتوى المكتبة الرقمية على الكتب الرقمية فقط بل يتعداه إلى غيرها من الوسائط. وبذلك تكون مواقع مثل Flickr و YouTube وغيرها مكتبات رقمية أيضا (ولو أنها متخصصة، فالصور لـFlickr والفيديو لـ YouTube). حتى إن البعض لا يتوانى في وصف الإنترنت بأنها المكتبة الرقمية العالمية.
تتتميز المكتبات الرقمية بأهدافها (تجارية، ثقافية..إلخ)، وحسب مواضيع مضامينها التي تركز عليها (دينية، أدبية، علمية، تقنية...إلخ) وحسب شكل المضامين (مستندات، صور، فيديو، صوت...إلخ).
محتويات
[أخف]انتشار المكتبات الرقمية[عدل]
مع انتشار تقنيات الكتب الإلكترونية، واعتناق الكثير من الشركات الكبرى مثل أدوبي ومايكروسوفت لتقنيات رقمنة النصوص وتوزيعها، فإن فكرة المكتبات الرقمية بدأت تنتشر انتشارا سريعا، يدعمها في ذلك التطور السريع في تقنيات حفظ المعلومات ورقمنتها واستعراضها والبحث فيها، إضافة إلى توفر الشابكة كبنية تحتية يمكن بواسطتها الربط بين المستخدم وبين المكتبات الرقمية المختلفة موفرة بذلك فضاء معلوماتيا رحبا يعادل في أهميته فضاء الإنترنت العام السائد اليوم.
تاريخ المكتبات الرقمية[عدل]
تتميز المواد أو الوسائط الرقمية عن غيرها، سواء كانت هذه المواد ملفات نصية، أو أفلام، أو موسيقى، بعدة مزايا. فالمواد (في معظم الأحيان) سهلة الإنتاج والنشر والتوزيع إلى الملايين بتكلفة زهيدة. فإنتاج كتاب بصيغة رقمية يختصر تكاليف الطباعة الورقية والنقل والتوزيع الباهضة. فيكفي إنتاج نسخة رقمية واحدة توضع علىخادوم مركزي وبيعها للمشترين الذين يتصلون بالخادوم عبر (الشابكة (الانترنت)). وبالتالي فإن تكلفة بيع كتاب إضافي هي صفر بالنسبة للشركة الناشرة، وكل ما تجنيه من بيع النسخة الرقمية يعتبر ربحا صافيا.
مشاريع رائدة[عدل]
مشروع غوتنبرغ[عدل]
- مقالة مفصلة: مشروع غوتنبرغ
من أقدم المكتبات الرقمية مشروع غوتنبرغ. لم يكن الربح التجاري هدف الشاب مايكل هارت في عام 1971 عندما قام بإنشاء أول مكتبة رقمية، واختار اسم غوتنبرغعلى اسم مخترع الطباعة في القرن الخامس عشر، الذي فتح أفقا جديدا لإصدار الكتب مؤذنا ببدء عصر التنوير في أوروبا وتمكين المواطن الأوروبي العادي من اقتناء وقراءة الكتب.
واير تاب[عدل]
هارت لم يكن وحده في جهوده الرامية إلى إنشاء أضخم مكتبة إلكترونية للنصوص الرقمية، حيث ظهر في أوائل التسعينيات مشروع واير تاب وهو موقع يستخدم إلى اليوم تقنية غوفر لتداول الملفات عبر الشبكة، ويحتوي على مجموعة هائلة من النصوص الرقمية المتخصصة، كنصوص المعاهدات والقوانين الدولية، والوثائق التقنية والعسكرية وما إلى ذلك.
وفي عام 1993 قام شاب اسمه جون مارك أوكربلوم، وكان طالبا في علوم الحاسوب ويعمل كمدير لموقع إنترنت الخاص بجامعة كارنيغي ميلون، ببدء العمل على فهرس يضم وصلات إلى جميع الكتب الإلكترونية الموجودة على الشبكة بما في ذلك مشروع غوتنبرغ. وأطلق أوكربلوم على فهرسه هذا اسم صفحة الكتب الإلكترونية The Online Books Page.
وفي عام 1998 حصل أوكربلوم على درجة الدكتوراه في علوم الحاسوب وانتقل إلى جامعة بنسلفانيا حيث أخذ يعمل على الأبحاث المتعلقة بعلم المكتبات الرقمية في مكتبة الجامعة وقسم علوم الحاسوب، مرتكزا على فهرسه الأساسي الذي طوره في جامعة كارنيغي ميلون والذي أصبح الآن جزءا من مراجع المكتبات الرقمية لدى جامعة بنسلفانيا ويحتوي الموقع اليوم على وصلات لعشرات الألوف من الكتب الإلكترونية المجانية باللغة الإنجليزية أو غير المجانية ولكن التي سمح مؤلفوها بنشرها عبر الشابكة. كما يحتوي الموقع على وصلات إلى العديد من المواقع التي تقوم بنشر الكتب الإلكترونية مثل مشروع غوتنبرغ.
ولا تقوم أية جهة رسمية بتمويل الموقع، ولا زال أوكربلوم يقوم إلى اليوم بالاعتناء بالموقع مجانا ودون أي مقابل.
المكتبات الرقمية التجارية[عدل]
- مقالات مفصلة: نيل وفرات (موقع)
- أمازون دوت كوم
وفي ذروة عصر الدوت كوم أدرك بعض رواد المكتبات الرقمية أنه رغم الانتشار السريع لإنترنت، وصيرورتها أحد أهم المصادر المعلوماتية، فإن الكثير من المعارف البشرية الهامة لا تزال محتجزة في بطون الكتب. ولكن هؤلاء لم يكونوا من الثوريين المتمردين أمثال هارت وأوكربلوم، ولكنهم كانوا رجال أعمال تقليديين أرادوا استغلال الفرص التجارية التي يمكن للمكتبات الرقمية أن توفرها لهم. ومن بين هؤلاء كان تروي وليامز المدير التنفيذي والمؤسس لموقع questia، والذي يعتبر اليوم أكبر مكتبة رقمية ذات طابع تجاري في العالم.
ففي بداية عام 1998، وربما أثناء وقوفه في طابور أجهزة تصوير الوثائق، أو طابور استعارة الكتب في إحدى الجامعات الأمريكية، أدرك وليامز عدة أمور هي:
1) ألن يكون هؤلاء الطلبة مستعدين لدفع مبلغ معين من المال مقابل تجنب صفوف الانتظار، وعملية البحث المضنية عن الكتب المناسبة لأبحاثهم؟
2) تصوير الطلاب لصفحات من الكتب أو لكتب بأكملها يمثل فرصة ضائعة للشركات الناشرة لهذه الكتب.
3) ألن توفر المكتبات العامة والجامعية الكثير من التكاليف الإدارية لو قامت بالاعتماد على الكتب الرقمية وأتاحتها كمرجع للطلاب؟
وانطلاقا من هذه التساؤلات، وبعد حوالي العامين ونصف العام من التخطيط والدراسة والإعداد أطلق وليامز موقع Questia إلى الفضاء الخائلي. واعتمادا على نتائج دراسة الجدوى فقد اختار وليامز أن تتخصص كويستيا في مجال الكتب الرقمية الخاصة بالعلوم الإنسانية والاجتماعية، ورغم أنه كان بإمكان الموقع أن يحتوي يوم افتتاحه على أكثر من مائة ألف كتاب، فإنه بدأ بخمسين ألف كتاب متخصصة في ذلك المجال فقط. وتتلخص فكرة الموقع في أن الطلاب الجامعيين والباحثين يطلبون عادة الكتب القديمة، وبالتحديد التي يزيد عمرها عن الخمسة سنوات. كما لاحظ وليامز أيضا أن شركات النشر تتوقف عن إعادة طباعة معظم الكتب بعد سبع سنوات من نشرها، ولكن هذه الكتب تحتفظ بقيمتها لمدة ثلاثين سنة أو أكثر. لذا قامت كويستيا بالتعاقد مع أكثر من 170 ناشرا (عددهم اليوم هو 235)، وحصلت منهم على حقوق رقمنة كتبهم التي تتميز بهذه الصفة، ومن ثم إتاحتها للجمهور من خلال الموقع (وهو ما سنتحدث عنه بعد قليل). ولاختيار الكتب، قام وليامز بتوظيف عشرة مختصين في علم المكتبات، وبالذات من المتخصصين في علم انتقاء مجموعات الكتب. وقام هؤلاء باختيار خمسين ألف من أفضل الكتب المتوفرة لدى الشركات الناشرة، وهي الكتب التي شكلت نواة المشروع. ورغم أن هذه المكتبة صغيرة بالمقارنة مع المكتبات التقليدية فإنها تتميز بأن الكتب متوفرة دوما للمستخدمين، كما أنه يمكن لكل مستخدم الحصول على نسخته الخاصة من الكتب المتوفرة. وتقوم كويستيا بتوفير الخدمة للطلاب الجامعيين والباحثين في مجال العلوم الاجتماعية والإنسانية، حيث يقوم الطالب بالاشتراك في الموقع، ويتمكن مقابل اشتراكه من النفاذ إلى كامل محتوى الكتب الرقمية، والبحث في محتواها للعثور على المعلومات التي يريدها، باستخدام محرك بحث متقدم من أوراكل وهو برنامج ConText، إضافة إلى أن كويستيا تقوم بتعليم البيانات باستخدام لغة XML، مما يجعل عملية العثور على المعلومات أكثر سهولة. ويمكن للطلبة أن يقوموا بطباعة نتائج عمليات البحث التي يقومون بها. ولكن الموقع يوفر ما هو أكثر من المراجع، كأدوات لكتابة الملاحظات على الصفحات، وإنشاء الحواشي، وفهارس المراجع (وذلك لتشجيع الطلبة على ذكر المراجع التي حصلوا منها على معلوماتهم). كما يحتوي الموقع على العديد من القواميس والفهارس، إضافة إلى إمكانية وضع مجموعات معينة من الكتب ضمن رف رقمي شخصي. وماذا عن الشركات الناشرة للكتب؟ ما تقدمه خدمة كويستيا للشركات الناشرة يفوق مجرد شراء حقوق النشر، حيث تحصل هذه الشركات على نسبة معينة من إيرادات الاشتراكات ضمن الموقع، وهو مصدر دخل من كتب لا تدر في العادة عوائد على الشركات، كما أن المستفيدين منها عادة هم مراكز تصوير ونسخ الكتب التي يلجأ إليها الطلبة عادة. ولا يؤمن وليامز بجدوى سوق الكتب الرقمية خلال الأعوام الثلاث القادمة، حيث أن المنتجين لم يستقروا بعد على نسق قياسي يتم بموجبه إنتاج الكتب الرقمية، ولا زال السوق بحاجة إلى تحديد النسق الأفضل. كما أنه يعتقد أن الطلب غير موجود من قبل القراء (يجدر الإشارة إلى أن موقع أمازون يبيع الكتب الرقمية). ومن جهة أخرى يرى وليامز أن الطلب في الوقت الحالي يتمركز حول استخدام إنترنت لكتابة أوراق البحث. وما يقوم به هؤلاء الطلاب في الوقت الحالي هو اللجوء إلى مصادر غير محكمة أو موثقة على إنترنت. وما توفره كويستيا هو مراجع موثقة ومحكمة من الدرجة الأولى يمكن استخدامها لكتابة أبحاث أفضل.
المكتبات الرقمية عربيا[عدل]
بدأت تظهر المكتبات الرقمية في العالم العربي سواء بمبادرات مؤسسية أو فردية. واختلف مجهود كل مبادرة بين جمع المضامين الرقمية وفهرستها وعرضها وبين مجهودات لرقمنة كتب ومصادر ورقية. في مجال الرقمنة يذكر تجربة معهد الإمارات للأبحاث والدراسات الاستراتيجية، والذي قام قبل عامين برقمنة جميع نتاجه العلمي باستخدام نظام نوليدج بايز KnowledgeBase وإن اقتصرت اتاحة المكتبة فقط على العاملين ضمن المركز.
ومن المحاولات الأخرى لإنشاء مكتبة رقمية هو مكتبة الوراق (alwaraq.net)، والذي قامت شركة كوزموس للبرمجيات بإنشائه وتضمينه أمهات الكتب التراثية العربية، وميكانيكيات بحث ممتازة، ولكن هذا الموقع متخصص جدا في محتواه والذي يقتصر كما قلنا على الكتب التراثية العربية.
مكتبة المسجد النبوي الشريف[1] والتي تقوم بجمع كل الكتب الإسلامية في صيغة إلكترونية ووضعها في قواعد بيانات وإتاحة البحث فيها للباحثين والرواد.
المزايا[عدل]
من مزايا المكتبات الرقمية، بوصفها وسيلة سهلة وسريعة للوصول للكتب والمحفوظات والصور، اعتراف المصالح التجارية والهيئات العامة على حد سواء بها على نطاق واسع.[2]
مساحة التخزين في المكتبات التقليدية محدودة ؛ في حين أن للمكتبات الرقمية القدرة على تخزين معلومات كثيرة في مكان ضيق، كون أن المعلومات الرقمية تحتاج لفضاء مادي صغير جدا لتخزينها. على هذا النحو، فإن تكلفة صيانة مكتبة رقمية هي أقل بكثير من مكتبة تقليدية.
تنفق المكتبة التقليدية مبالغا كبيرة من المال على مرتبات الموظفين والإيجار واقتناء كتب جديدة وصيانة الموجود منها. أما المكتبات الرقمية فتخفض هذه التكاليف وفي بعض الحالات تتخلص منها. كما أن المكتبات الرقمية أكثر استعدادا لتبني الابتكارات الجديدة في مجال التكنولوجيا، فهي توفر لمستخدميها تحسينات مستفيدة من تكنولوجيا الكتاب الإلكتروني والصوت فضلا عن تقديمها لأشكال جديدة من الاتصالات مثل الويكي والمدونات. قد توفر المكتبات التقليدية عبر الإنترنت دليلا لمحتوياتها (Online public access catalog : OPAC). تسمح الرقمنة المواد بتسهيل إيصالها لطالبيها. كما أنها تفتح المجال لرواد جدد غير تقليدين للمكتبة وذلك بسبب الموقع الجغرافي أو الانتماء التنظيمي.
- لا حدود فعلية : المستخدم للمكتبة الرقمية لا يحتاج للتنقل إلى المكتبة، فالوصول للمكتبة الرقمية متاح من جميع أنحاء العالم طالما كان الاتصال بالإنترنت متاح.
- مفتوحة على مدار الساعة : الميزة الرئيسية للمكتبات الرقمية هي إمكانية الوصول إليها 24 ساعة / 24 7 أيام/7.
- وصول متعدد : غالبا ما يمكن لأكثر من طرف استخدام نفس الموارد في الوقت ذاته. قد لا يكون الأمر كذلك بالنسبة لمواد خاضعة لحقوق الطبع والنشر : فقد يكون للمكتبة ترخيص بـ "إقراض" نسخة واحدة فقط في وقت واحد ؛ ويتحقق ذلك مع نظام إدارة الحقوق الرقمية حيث يمكن أن تصبح مصدرا لا يمكن الوصول إليها بعد انقضاء فترة الإقراض أو بعد أن يختار المقرض جعلها غير قابلة للوصول (وهو ما يعادل إعادة الموارد).
- استخراج المعلومات: يمكن للمرتاد المكتبة استخدام أي مصطلح (كلمة، جملة، والعنوان والاسم والموضوع) للبحث في المجموعة بأكملها. كما يمكن للمكتبات الرقمية توفير واجهات سهلة الاستخدام متيحة الوصول لمواردها بالنقر.
- حفظ وصيانة: الرقمنة ليست حلا للمحافظة على المدى الطويل للمجاميع المادية، ولكنها تنجح في توفير نسخ من المواد لطالبين كثر لو استعملوا الأصل لتدهور من الاستخدام المتكرر. الحفظ على المجاميع المرقمنة أو المواد رقمية الأصل خلق العديد من الشواغل تخص حفظ المواد لا التناظرية. الرجاء فقرة "المشاكل" للحصول على أمثلة.
- الفضاء : في حين تقتصر المكتبات التقليدية على مساحة تخزين محدودة، فإن للمكتبات الرقمية القدرة على تخزين معلومات أكثر في فضاء مادي صغير جدا وبأسعار معقولة من أي وقت مضى بفضل تكنولوجيات تخزين الوسائط المتعددة.
- قيمة مضافة: يمكن تحسين خصائص معينة في المواد، نوعية الصور في المقام الأول. كما يمكن للرقمنة تعزيز الوضوح وإزالة العيوب مثل البقع وتغير الألوان.[3]
- سهولة الوصول.
المشاكل والتحديات[عدل]
رغم التطورات الكبيرة في مجال تقنيات الكتب والمكتبات الرقمية فلا زال أمامها شوطا بعيدا كي تقطعه لتحقيق الانتشار الكامل.
حقوق النشر والتأليف[عدل]
من ناحية يجمع الكثيرون من أقطاب الصناعة على أن تقنيات حماية وإدارة حقوق الملكية الفكرية الخاصة بالمحتوى الرقمي لم تحقق بعد مستوى الأمن المطلوب، حيث لا زال من السهل كسر التشفير الخاص بالكثير من هذه الأدوات، كما حصل في حالة شركة أدوبي مؤخرا حين تمكن أحد الهكرة الروس من كسر شيفرة كتبها الرقمية. وترى شركات النشر أنه ما لم يتم حل هذه المعضلة فإنهم يخشون أن تؤول الكتب الرقمية إلى مصير مشابه لما حصل في صناعة الموسيقى عند ظهور نابستر، ويقولون بأن مصير التقدم البشري مرهون بحل هذه المشكلة، فإذا ما تمت قرصنة الكتب على نطاق واسع فإن ذلك سيؤدي إلى امتناع المؤلفين عن الكتابة والنشر، مما سيؤدي إلى تضاؤل النتاج العلمي.
ولكن شركات النشر تخوض حربا شرسة لتمديد الفترة التي يكون فيها كتاب ما خاضعا لحقوق الملكية الفكرية. وقد نجحت الشركات الأمريكية في عام 2000 إلى مد الفترة التي يكون فيها كتاب ما خاضع لحقوق الملكية الفكرية إلى 75 عاما بعد موت المؤلف، وهو تمديد يهدد المكتبات الرقمية المجانية من أمثال مشروع غوتنبرغ، والذي يتخصص في رقمنة الكتب التي لم تعد خاضعة لقوانين حماية المؤلف، والتي كانت في الماضي تسقط عن الكتب بعد 25 عاما من موت المؤلف. ويقول مايكل هارت وأوكربلوم بأن هذه القوانين تحمي الشركات الناشرة وأرباحها فقط. ويقول أوكربلوم مازحا بأنه طبقا لهذا القانون فإن المخططات الهندسية لأول طائرة، والتي ابتكرها الأخوان رايت، لا تزال محمية بقوانين حماية المؤلف الجديدة.
حفظ المواد الرقمية[عدل]
الحفظ الرقمي يهدف إلى ضمان بقاء وسائل الإعلام الرقمية ونظم المعلومات قادرة على قراءتها وتفسيرها في المستقبل إلى أجل غير مسمى. يجب أن يتم ترحيل كل المكونات الضرورية والحفاظ عليها أو محاكات عملها.[4] عادة ما يتم محاكاة مستويات الدنيا من أنظمة (قرص مرن على سبيل المثال)، bit-streams (الملفات الفعلية المخزنة في الأقراص) وأنظمة التشغيل يجري محاكاتها على جهاز ظاهري (بالإنجليزية: virtual machine). إلا إذا كان معنى ومضمون وسائل الإعلام الرقمية ونظم المعلومات مفهومة جيدا ويمكن ترحيلها، كما هو الحال بالنسبة للوثائق مكتب.[4][5][6]
البنية والتنظيم[عدل]
يوجد فرق شاسع بين أتمتة المكتبات ورقمنتها. ففي حين تعنى الأتمتة بحوسبة العمليات المكتبية مثل استعارة الكتب وفهرستها وتنظيم العمليات الداخلية للمكتبات، فإن رقمنة المكتبات تعني تحويل مجموعات من الكتب ضمن المكتبات التقليدية إلى صورة رقمية سواء بمسحها ضوئيا، أو إدخالها كنص إلكتروني.
وتوصي شركة صن مايكروسيستمز، وهي من الشركات الرائدة في إنشاء المكتبات الرقمية في الولايات المتحدة، بأخذ النقاط التالية بعين الاعتبار عند إنشاء المكتبات الرقمية.
- اعتماد نسق موحد للمعلومات (توصي صن باعتماد XML)
- أسلوب النفاذ إلى المكتبة الرقمية-هل سيكون مفتوحا للعموم عبر إنترنت أم سيقتصر على فئة معينة من المستخدمين
- الأمان والتحقق من هوية المستخدمين
- برمجيات حماية حقوق الملكية الفكرية
- البنية التحتية للمشروع من برمجيات وقواعد بيانات ومدى قدرتها على التوسع واستيعاب الأعداد المتزايدة من المستخدمين
- محرك البحث المستخدم. المكتبة الرقمية لا تفيد بشيء إذا ما لم تستخدم محرك بحث قوي.
- وسائط التخزين وحفظ البيانات وقدرتها على التوسع، وأساليب التخزين الاحتياطي التي تعتمدها.
معايير اختيار المجاميع الرقمية[عدل]
تطبق الهيئات (عادة المكتبات) مجموعة من المعايير لاختيار المضامين الرقمية لإنشاء مكتبة رقمية من ممتلكاتها الحالية لرقمنتها واقتناء المرقمنة مستقبلا.
امتلاك استراتيجية ذات أولويات اختيار محددة للرقمنة أمر بالغ الأهمية. العوامل التي ينبغي أخذها في الاعتبار :
- قيمة المواد
- حالة المواد
- استخدام المواد
- الخصائص المادية الضمانة لمستوى عال من النجاح
بالنسبة لمكتبة الكونغرس، المتعلقات ذات الاهتمام الوطني هي مرشحة للعرض وتقليل الأذى على النسخ الأصلية [7].
في المناقشات المبكرة حول رقمنة مواد المكتبات، في كثير من الأحيان اقترحت قرارات الاختيار على أساس الرغبة في تحسين فرص الحصول على المحتوى، وليس على شرط أو قيمة العنصر الأصلي.[8] وفي عام 2001، كتبت بولا دي ستيفانو [9] أن استخدام مجموعة من المعايير المستندة هو أمر واعد، كما هو "الأساس في تنمية المجاميع والقاسم المشترك بين جميع قرارات الاختيار". ومع ذلك في الممارسة العملية، أظهرت دراسة لها أن معظم المشاريع الرقمية ركزت على مجموعات خاصة، والتي عموما ليست المواد الأكثر شعبية في المجموعة الشاملة.
وفي ورقة بيضاء لمجلس عن المكتبة ومصادر المعلومات سنة 1998[10]، حددت الاعتبارات التالية الشاملة للاختيار :
- تقييم الطبيعة الفكرية والمادية من لمصدر المواد ؛
- عدد وموقع من المستخدمين الحاليين والمحتملين ؛
- الطبيعة الحالية والمحتملة للاستخدام ؛
- شكل وطبيعة المنتجات الرقمية المقترحة وكيف سيكون وصفها، تسليمها، وحفظها ؛
- كيف يتعلق المنتج المقترح بجهود رقمنة الأخرى ؛ و
- التوقعات للتكاليف فيما يتعلق بالمنافع.
طالع أيضا[عدل]
مقالات ذات صلة[عدل]
مصادر[عدل]
وصلات خارجية[عدل]
- دليل DMOZ للمكتبات الرقمية
- المكتبة الشاملة أكثر البرامج الشرعية شهرة وانتشارًا بين طلبة العلم على مستوى العالم
- المكتبة العربية هي مكتبة عربية مجانية إلكترونية تقنية في العالم
- موقع مشروع غوتنبرغ
- مكتبة الوراق لكتب التراث العربي
الهوامش والمراجع[عدل]
- ^ موقع مكتبة المسجد النبوي الشريف
- ^ (إنجليزية) European Commission steps up efforts to put Europe’s memory on the Web via a “European Digital Library” Europa press release, 2 March 2006
- ^ (إنجليزية) Gertz, Janet. "Selection for Preservation in the Digital Age." Library Resources & Technical Services. 44(2) (2000):97-104.
- ^ أ ب Cain, Mark. “Managing Technology: Being a Library of Record in a Digital Age”, Journal of Academic Librarianship 29:6 (2003).
- ^ Breeding, Marshall. “Preserving Digital Information.”. Information Today 19:5 (2002).
- ^ Teper, Thomas H. "Where Next? Long-Term Considerations for Digital Initiatives." Kentucky Libraries 65(2)(2001):12-18.
- ^ Digitizing for Access and Preservation: Strategies of the Library of Congress
- ^ Gertz, J. (2000 April). Selection for preservation in the digital age: An overview. Library Resources & Technical Services, 44(2), 97-104.
- ^ De Stefano, Paula. (2001, January). Selection for digital conversion in academic libraries. College & Research Libraries62(1), 58-69.
- ^ Selecting Research Collections for Digitization
ليست هناك تعليقات:
إرسال تعليق