ما معنى صيغة pdf؟ PDF - ما هو وكيف يعمل وكيفية استخدامه

20.04.2019

تعتمد خصائص مستند PDF والإجراءات التي يمكنك تنفيذها بها على البرنامج الذي تم إنشاؤه فيه. لذلك، يتم دائمًا دعم النسخ والبحث عن النص في بعض مستندات PDF، وفي بعض الأحيان يكون ذلك ممكنًا فقط في ABBYY FineReader.

يمكن التمييز بين الأنواع التالية من مستندات PDF:

PDF (صورة فقط)

يتم الحصول على هذا النوع من مستندات PDF عن طريق مسح المستندات الورقية ضوئيًا بدون التعرف الضوئي على الحروف. كل صفحة من هذا المستند هي صورة ولا تحتوي على طبقة نص. لا يمكن البحث في مستندات PDF (الصور فقط) أو نسخها أو تحريرها، بغض النظر عن عارض PDF المستخدم.

وثائق PDF قابلة للبحث

تحتوي هذه المستندات عادةً على صورة مرئية للصفحة وطبقة نص غير مرئية أسفلها. غالبًا ما يكون هذا النوع من المستندات عبارة عن نسخة ممسوحة ضوئيًا من مستند ورقي تم تطبيق التعرف عليه، وتم كتابة النص الذي تم التعرف عليه أسفل الصفحات.

عند فتح مستندات من هذا النوع، يحدد FineReader ما إذا كان ملف PDF يحتوي على طبقة نص ويمكن استخدامه عند العمل مع مستند PDF. انظر المزيد من التفاصيل.“أوضاع التعرف على PDF”. يتيح وجود طبقة النص إمكانية البحث عن النص ونسخه بغض النظر عن برنامج عرض مستندات PDF. يتوفر هذا النوع من تحرير نص PDF في FineReader، ولكن قد لا يكون مدعومًا في برامج تحرير أخرى.

باستخدام FineReader، يمكن الحصول على مستندات من هذا النوع:

  1. عند إضافة طبقة نص إلى ملف PDF (صورة فقط).
  2. عند تحويل PDF أو أي ملفات صور. للقيام بذلك، حدد > النص الموجود أسفل صورة الصفحة. انظر المزيد من التفاصيل.إعدادات تنسيق PDF.

مستندات PDF التي تم إنشاؤها في تطبيقات أخرى

يتم إنشاء هذا النوع من المستندات عن طريق إنشاء ملف PDF من تنسيقات قابلة للتحرير (مثل Microsoft Word أو تطبيقات Office الأخرى) وهو نوع من مستندات PDF القابلة للبحث. أنه يحتوي على طبقة النص والرسوم التوضيحية. في مثل هذا المستند، يمكن البحث عن النص ونسخه بغض النظر عن برنامج عرض مستندات PDF، وتتوفر النصوص والصور للتحرير. لتنفيذ هذه الإجراءات، يجب أن يتمتع المستخدم بالحقوق المناسبة في هذا المستند.

يمكن الحصول على هذا النوع من مستندات PDF:

  1. عندما تقوم بحفظ المستند الأصلي بصيغة PDF مباشرة في البرنامج الذي تم إنشاؤه فيه.
  2. عند تحويل مستند PDF من نوع مختلف أو ملف بتنسيق مختلف في FineReader عند تحديده في إعدادات الحفظ إعدادات PDF قابلة للبحث >النص والصور فقط. انظر المزيد من التفاصيل.إعدادات تنسيق PDF.

ونتيجة لذلك، قد يختلف تنسيق المستند عن المستند الأصلي، ولكن تحرير مثل هذا المستند يمكن أن يؤدي إلى نتائج أفضل.

تحيات أصدقاء!

لقد تلقيت مؤخرًا عرضًا لكتابة مراجعة للبرنامج بتنسيق قابل للتحرير. وبطبيعة الحال، لم أستطع رفض مثل هذا العرض، خاصة وأنهم وعدوني بإعطائي ترخيصا كاملا لهذا البرنامج. ومن الرائع أن تتواصل بصدق مع مطور أجنبي مباشرة، وليس من خلال الدعم)))

فيما يتعلق بمسألة معرفة اللغة الإنجليزية. أنا، مثل الكثيرين في بلدنا، أتحدث لغتين فقط)) اللغات: الروسية والفاحشة))) لكن هذا لا يمنعني من التواصل بهدوء مع المطورين الأجانب وبدعم (لدي وأضطر في بعض الأحيان إلى طرح الأسئلة).

هذه هي الطريقة التي نتواصل بها: يتحدثون معي باللغة الإنجليزية، وأنا أتحدث معهم باللغة الروسية. علاوة على ذلك، كتبت ذات مرة أنني آسف، أنا لا أتحدث الإنجليزية، ولكن ردًا على ذلك تلقيت: "حسنًا، يا رجل، أنا لا أتحدث الإنجليزية كثيرًا بنفسي، أعيش في الهند، وأعمل في الدعم عن بعد وأستخدمه بسهولة مترجم جوجل " مثله…

أنا جالس هنا منذ أسبوع، أتقلب وأدرس البرنامج، حتى أنني كدت أن أجلس لكتابة مراجعة... لكن قبل أن أكتب عن البرنامج (برنامج جيد جدًا، بالمناسبة)، قررت للكتابة عن ملفات PDF مرة أخرى.

بهدوء! لا داعي لإغلاق المقال!

الشيء هو أن ملفات PDF مختلفة. نعم، نعم، مختلف تماما. وهذا هو سبب فشل العديد من الأشخاص في تحرير ملفات PDF. علاوة على ذلك، قمت مؤخرًا بتطوير بنية معينة لما تبدو عليه ملفات PDF.

لذلك، إذا نظرنا إلى ملفات PDF من وجهة نظر إنشائها، نحصل على ما يلي:

أولاً. PDF كصور

هناك طريقتان فقط لتحرير ملفات PDF هذه:

  • افتحه في محرر رسومي، على سبيل المثال Photoshop، وقم بتحريره مثل الصورة (تغيير السطوع والتباين، وتغيير التشبع، والقص والمسح، وما إلى ذلك). ولكن إذا قمت بمسح النص ضوئيًا، فيمكنك القيام بذلك بشكل أسهل.
  • استخدم برنامج التعرف على النص، ما يسمى بنظام التعرف الضوئي على الحروف (OCR). على مدار العشرين عامًا الماضية (!) التي كنت أستخدم فيها هذه الأنظمة بنشاط، لم أر بعد أي شيء أفضل من برنامج FineReader. لا، وجدت حلولاً جيدة، لكن كقاعدة عامة، كانت لديهم مشاكل في التعرف على اللغة الروسية...

ثانية. ملفات PDF التي تم إنشاؤها من تطبيقات مختلفة

قبل بضع سنوات فقط، كان إنشاء ملف PDF يمثل مشكلة؛ وكان عليك استخدام نوع ما من ملفات . لا يزال التقدم ثابتًا ويمكنك حاليًا إنشاء ملف PDF من أي تطبيق مكتبي تقريبًا (كتبت كيفية إنشاء ملف pdf في Word).

لذلك، يمكن تحرير ملفات PDF التي تم إنشاؤها بهذه الطريقة بأي طريقة وبأي شيء تقريبًا. ما يصل إلى نسخة لصق بسيطة.

بالمناسبة، أي ملف PDF يفتح بشكل رائع في Photoshop، ضع في اعتبارك...

قد يكون الاستثناء هو المستندات المحمية. لكن هذه قصة أخرى مسلية إلى حد ما... حتى أنني أجريت عدة تجارب لتثبيت الحماية وإزالتها، لكنني سأخبركم بذلك مرة أخرى.

ثالث. ملفات PDF التفاعلية

الاتجاه الحديث في عرض المواد الالكترونية. يمكن تحويل الكتب والمجلات والسير الذاتية وغير ذلك الكثير إلى ملفات PDF تفاعلية. حتى النماذج المختلفة يمكن اعتبارها تفاعلية، فقط لأنه بعد ملء هذا النموذج يمكن إرسالها عبر البريد الإلكتروني باستخدام زر "إرسال" المدمج مباشرة في مستند PDF (ولكي نكون منصفين، تجدر الإشارة إلى أن هذه الوظيفة يتم تنفيذها بدلاً من ذلك بشكل أخرق - بالنقر فوق الزر "إرسال"، يتم تشغيل عميل البريد الإلكتروني، مثل OutLook، حيث يتم بالفعل فتح رسالة جديدة مع ملف مرفق...)

من بين أمور أخرى، يسمح لك ملف PDF الحديث بتضمينه وبالتالي عرضه في أي عارض PDF:

  • الروابط الخارجية والداخلية
  • المتزلجون (معرض الصور ذاتية الانزلاق)
  • أشرطة فيديو
  • المسارات الصوتية
  • عناصر الواجهة (الأزرار، القوائم، القوائم المنسدلة)
  • تكبير الصور عند التمرير
  • الرسوم المتحركة المختلفة

باختصار، يمكنك إنشاء موقع ويب حديث تقريبًا بجميع وظائفه بتنسيق PDF.

ولكن هناك أيضًا عيوب هنا:

أولا، لتنفيذ مثل هذا النشاط التفاعلي، ستحتاج إلى أن تكون قادرا على استخدام برنامج InDesign بمستوى جيد.

ثانيا، لا يمكن أن تعمل هذه الملفات دائما وليس على جميع أجهزة الكمبيوتر (يجب تثبيت مشغل فلاش على الكمبيوتر).

ثالثًا، تعمل ملفات PDF التفاعلية هذه بشكل سيء للغاية على الأجهزة المحمولة، ويرجع ذلك على وجه التحديد إلى انخفاض طاقة هذه الأجهزة (على الرغم من أن اللحظة تقترب عندما يكون الهاتف أقوى من الكمبيوتر المكتبي، ناهيك عن أجهزة الكمبيوتر المحمولة) واستحالة التكيف وثيقة PDF لحجم الأجهزة المحمولة.

رابعًا، لم أتمكن من جعل الرسوم المتحركة بتنسيق gif تعمل بصيغة pdf، ويبدو أن هذا الشيء غير مدعوم. إذا كان أي شخص يعرف كيفية عمل الرسوم المتحركة بتنسيق GIF بتنسيق PDF، فأخبرني بذلك في التعليقات.

ومن ناحية أخرى، فإن مزايا ملف PDF التفاعلي تفوق جميع عيوبه. وإذا لزم الأمر، فإن تحرير أو تحويل مثل هذا الملف يكون أمرًا بسيطًا مثل ملف PDF مصنوع من Word.

فيما يلي الأنواع الأساسية لملفات PDF التي أصبحت منتشرة على نطاق واسع اليوم... هناك أيضًا أنواع مدمجة، على سبيل المثال، يمكنك الجمع بين صورة PDF وملف PDF تفاعلي. كما هو الحال دائمًا، كل هذا يتوقف على ما تحتاج إلى الحصول عليه من ملف pdf.

وبهذا أيها الأصدقاء الأعزاء أقول لكم وداعاً حتى المقال التالي. حظا موفقا للجميع!

تفاصيل الوثيقة

في علامة التبويب تفاصيل الوثيقة، يمكن للمستخدم ملء الحقول التالية: العنوان، الموضوع، المؤلف، التطبيق، الشركة المصنعة، وكذلك إضافة بعض الكلمات الرئيسية المقابلة لمحتوى المستند.

أمان

يمكنك تقييد الوصول إلى مستند PDF باستخدام كلمة مرور/شهادة وقيود على وظائف معينة، مثل الطباعة والتحرير. ومع ذلك، لا يمكنك منع حفظ نسخ PDF. في هذه الحالة، سيكون للنسخ نفس القيود الموجودة في ملف PDF الأصلي.

لتعيين كلمة مرور وإجراء تغييرات على العناصر الأذوناتانقر فوق الزر يتغير. ستظهر نافذة إضافية على الشاشة يمكنك من خلالها تعيين كلمات مرور للمستند.

لتشفير مستندات PDF، يمكنك استخدام نوعين من كلمات المرور:

  • كلمة المرور لفتح مستند. كلمة المرور هذه مطلوبة لفتح ملف محمي.
  • كلمة مرور المالك. إذا كان المستند لا يسمح بالوصول إلى الوظائف المقيدة (القسم الأذونات)، تم تعيين كلمة المرور لتغيير حقوق الوصول - كلمة مرور المالك. لا تحتاج إلى إدخال كلمة مرور لفتح المستند.

إذا كان ملف PDF محميًا بنوعين من كلمات المرور، فيمكنك إدخال أي من كلمات المرور المحددة لفتحه. وفي الوقت نفسه، لتغيير الوصول إلى الأذوناتيجب على المستخدم الدخول كلمة مرور المالك. ولضمان مستوى أعلى من الحماية، يُنصح بتعيين نوعين من كلمات المرور.

  • السماح بطباعة المستندات. الطباعة ممكنة بدقة لا تزيد عن 150 نقطة في البوصة.
  • طباعة عالية الدقة. الطباعة بأي دقة ممكنة.
  • انسخ المحتوى لسهولة الوصول إليه. يسمح للمستخدمين بتسليط الضوء على محتوى PDF ونسخه.
  • استرجاع محتويات الوثيقة. يتم تشفير محتوى المستند، ولكن لا يزال بإمكان محركات البحث الوصول إلى بيانات المستند.
  • املأ النماذج الموجودة أو قم بالتوقيع. يمكن للمستخدمين ملء حقول النموذج وإضافة توقيعهم الرقمي الإلكتروني. وهذا يمنعهم من إضافة تعليقات أو إنشاء حقول نماذج جديدة.
  • التعليق. تعبئة حقول النموذج وإضافة التوقيع الرقمي.
    يمكن للمستخدمين ترك التعليقات والتوقيع رقميًا وملء الحقول في النماذج. يتم بعد ذلك حرمان المستخدم من الحق في نقل الكائنات على الصفحة أو إنشاء حقول نموذج جديدة.
  • إدارة الصفحات والإشارات المرجعية. يسمح لك بإدراج الصفحات وحذفها وتدويرها وإنشاء الإشارات المرجعية والصور المصغرة.
  • تحرير مستند. يسمح لك بتغيير سياق (نص، صور...) للمستند.

العرض الأولي

في علامة التبويب العرض الأولييمكن للمستخدم تخصيص مظهر مساحة عمل المستند في المرة التالية التي يتم فتحها فيها في أي عارض PDF.

في علامة التبويب هذه، يمكنك ضبط المظهر الأولي للصفحات وشريط التنقل ومستوى التكبير/التصغير وخيارات النافذة وخيارات واجهة المستخدم. لعرض عروض PDF التقديمية، يمكنك ضبط عرض العرض الأولي على "فتح في وضع ملء الشاشة".

عند إعادة الفتح، سيتم تجاهل إعدادات هذه المعلمات إذا كانت في القائمة الرئيسية أدوات > خياراتفاتورة غير مدفوعة أساسي تم تحديد الخيار .

التنسيب والحجم.

  • لوحة التنقل.حدد علامة التبويب التي سيتم عرضها في شريط التنقل.
  • عرض الصفحة.تحديد وضع عرض المستندات المطلوب: صفحة واحدة، صفحة واحدة متواصلة، صفحتان، صفحتان متواصلتان، صفحتان مع صفحة غلاف، صفحتان متواصلتان مع صفحة غلاف.

الإصدار الحالي من Master PDF Editor يدعم فقط وضع العرض المستمر للصفحة.

  • حجم. ضبط مقياس الوثيقة.
  • افتح الصفحة.حدد رقم الصفحة التي ستبدأ منها عرض المستند. سيتم تجاهل هذه المعلمة إذا كانت علامة التبويب أجراءاتنافذة او شباك خصائص المستندتم تكوينه لتنفيذ بعض الإجراءات عند فتح مستند.

خيارات النافذة.

  • إظهار عنوان المستند بدلاً من اسم الملف.يظهر اسم الملف أو عنوان المستند في عنوان النافذة. يشار إلى اسم المستند في علامة التبويب معلومات حول الوثيقة.
  • فتح في وضع ملء الشاشة.يضبط الحد الأقصى لحجم نافذة المستند ويعرض المستند بدون شريط القوائم أو شريط الأدوات أو عناصر التحكم.

للخروج من وضع عرض المستندات بملء الشاشة، استخدم المفتاح F11. التحرير في هذا الوضع ممكن فقط عند استخدام مفاتيح التشغيل السريع.

  • مركز النافذة.الخاصية غير مدعومة. تمت إضافته للتوافق مع بعض البرامج الأخرى.
  • خيارات الأدوات المخصصة.تكوين عرض عناصر مساحة العمل.
  • إخفاء القائمة.إخفاء/إظهار القائمة.
  • إخفاء أشرطة الأدوات.إخفاء/إظهار شريط الأدوات.
  • إخفاء الضوابط.لا يدعم Master PDF Editor هذا الخيار. يتم إضافته للتوافق مع بعض البرامج الأخرى.

الخطوط

تحتوي علامة التبويب الخطوط على قائمة الخطوط المستخدمة في المستند.

أجراءات

في علامة التبويب هذه، يمكن للمستخدم تعيين الإجراء الذي سيتم تنفيذه عند فتح ملف PDF هذا الوثيقة في أي عارض: صفحة مفتوحة، ملف مفتوح، مفتوحويب الارتباط، إعادة ضبط النماذج، إظهار/إخفاء النماذج، إرسال النماذج، التنفيذجافا سكريبت.

إذا قمت بتعيين الإجراء الذي سيتم تنفيذه عند فتح مستند، فقم بتنفيذ إعدادات العنصر افتح الصفحة قسم التنسيب والحجم (فاتورة غير مدفوعة العرض الأولي) سيتم تجاهلها.

لمزيد من المعلومات حول الإجراءات المحددة مسبقًا في مستندات PDF، راجع خصائص نموذج PDF > .

تم تعيين الإجراء في علامة تبويب النافذة هذه خصائص المستندسيتم تنفيذه إذا كان في القسم قصة نوافذ التبويب خيارات > أساسيلم يتم التحقق من العناصر التالية: استعادة الجلسة الأخيرة عند بدء التشغيل و استعادة خيارات العرض الأخيرة عند إعادة الفتح

PDF (تنسيق المستندات المحمولة) ليس مجرد تنسيق معروف ومريح، ولكنه أيضًا التنسيق الوحيد الذي أصبح معيارًا منذ عام 2008. تم تطويره من قبل فريق Adobe Systems. حدد مطورو التنسيق لأنفسهم مهمة إنشاء تنسيق عرض المستند بحيث يتم فتح المستند ويبدو بنفس الشكل على أي جهاز.

لقد قمنا بالفعل بمراجعة PDF لفترة وجيزة في المقالة، وسنحاول اليوم تحديد مزايا وعيوب تنسيق المتجهات هذا.

غالبًا ما يرتبط ملف PDF بـ "مكتب بلا ورق"، وفي حالة التصميم - بالتحضير للطباعة ونقل المخططات الرسومية إلى دار الطباعة.

المميزات والعيوب.

الايجابيات:
— التوحيد والشعبية: يتم فتحه على أي جهاز مزود بأي نظام تشغيل بالشكل الذي تم إنشاؤه به تمامًا؛
- غالبًا ما يكون عارض PDF، Adobe Acrobat Reader، مثبتًا مسبقًا على الكمبيوتر إذا كان الجهاز مزودًا بنظام تشغيل. إذا لم يكن الأمر كذلك، فهو متاح للتنزيل من موقع مطور Adobe Systems وهو مجاني تمامًا؛
— يشغل مساحة صغيرة على محرك الأقراص الثابتة لأنه يدعم العديد من خوارزميات الضغط؛
— الأمان: يمكن للمستخدم تكوين إعدادات الأمان لملف PDF الخاص به، على سبيل المثال، حظر الطباعة، حظر التحرير، استخدام التوقيع الإلكتروني لتحديد صحة المستند، وما إلى ذلك.

السلبيات:
— محرر ملفات PDF – مدفوع؛
- يعد تحرير ملفات pdf في البرامج المتخصصة أكثر صعوبة من أي ملفات رسومية أخرى؛
— من الصعب التعامل مع النص في ملفات PDF، حيث يُنظر إليه على أنه صورة.

أين يتم استخدامه؟

يتم استخدام تنسيق PDF لتخزين ونقل المعلومات النصية والرسومية على الشبكة، على سبيل المثال، لإرسال ترويسة إلى دار الطباعة أو نشر استبيان على موقع ويب. رائعة لعرض عملك: من السهل العرض، ومن الصعب التعديل. وهذا يجعل سرقة الملكية الفكرية أكثر صعوبة. حسنًا، لقد استقبلت فكرة "المكتب بلا أوراق" ضجة كبيرة من قبل كل من يفكر في بيئة الكوكب.

أنا لا أتعامل مع PDF كمستخدم فحسب، بل أولاً وقبل كل شيء، كمطور برامج يمكنه قراءته وكتابته (ربما صادفت منتجات ABBYY التي تعمل مع PDF - ABBYY FineReader، ABBYY PDF Transformer). أفترض أنك قرأت المقالة habrahabr.ru/company/abbyy/blog/105006 ثم أكتب فقط عن بعض ميزات وقيود PDF الأكثر إثارة للاهتمام للمستخدمين المتقدمين. لن أتطرق إلى أي تفاصيل فنية معقدة، لذلك يجب على المبرمجين الذين يرغبون في تعلم كيفية قراءة ملف PDF أو كتابته الانتقال مباشرة إلى قراءة مواصفات الإصدار 1.7 من الصفحة www.adobe.com/devnet/pdf/pdf_reference_archive.html :)

الغرض وميزات PDF
تم تصميم تنسيق PDF في الأصل بواسطة شركة Adobe في أواخر الثمانينيات من القرن الماضي باعتباره "نسخة ورقية إلكترونية" من المستندات المنظمة على شكل صفحة والتي يمكن عرضها وطباعتها في شكل مطابق للأصل على أجهزة ومنصات مختلفة، ولكنها ليس المقصود أن يتم تحريرها. يميز هذا التعريف PDF عن معظم التنسيقات الأخرى لتخزين وتوزيع المستندات التي يمكن للبشر قراءتها. على مر السنين، تطور ملف PDF بشكل كبير، حيث أصبح الآن حاوية لمجموعة واسعة من المحتوى (النص، والرسومات المتجهة والنقطية، والعناصر التفاعلية، والنماذج، والصوت، والفيديو، والشروح من أنواع مختلفة)، ولكن غرضه الأصلي لا يزال هو المصدر. بكل من قدراتها، والقيود العديدة.

وبالتالي، فإن تنسيقات المستندات النصية (DOC، RTF، DOCX، وما إلى ذلك) لا تهدف بشكل أساسي إلى عرض المستندات، بل إلى تحريرها. تم إنشاؤه بواسطة مستخدم عاقل :) يتفاعل المستند منطقيًا مع إدراج/استبدال/حذف النص والصور والجداول في أماكن مختلفة، وتغيير أحجام الصفحات والهوامش، وتغيير تنسيق أجزاء النص من أي حجم، والإجراءات المماثلة. صفحات الإنترنت بتنسيق HTML ليست موجهة بشكل كبير نحو التحرير (على الرغم من أنها تسمح بذلك)، ولكنها تخضع للأيدي المباشرة للمؤلف، وعادةً ما تنقل العرض ليس فقط على شاشة العرض الخاصة بمنشئها، ولكن أيضًا على الأجهزة ذات الشاشات المختلفة تمامًا وتفاعل المستخدم.

تقوم طابعة PDF بترجمة أوامر الإخراج GDI ("واجهة جهاز الرسومات") إلى المواقع المطلوبة من الأحرف والخطوط والمنحنيات والمستطيلات والصور النقطية والأوليات الهندسية الأخرى إلى أوامر PDF المقابلة لها وحفظها في ملف. وفي هذه الحالة بالطبع يتم حفظ عدد وحجم الصفحات التي تم طباعتها.

مثل هذا التحويل قادر على نقل مظهر النتيجة بدقة شديدة قبل الطباعة (على سبيل المثال، لا تفقد الخطوط والرموز وضوحها عند أي مقياس ويتم تخزينها بشكل مضغوط تمامًا)، ولكنها تتجاهل تمامًا بنية المستند الذي جاءت منه . على سبيل المثال، لوضع خط تحت كلمة أو جزء آخر من النصلا يوفر PDF أمرًا أو سمة مخصصة للأحرف - بدلاً من ذلك، يتم عرض الأحرف بشكل منفصل (في مجموعات لا تتطابق عادةً مع الكلمات أو الخطوط)، ويتم رسم الخطوط أو المستطيلات الرفيعة بالسمك واللون المطلوب بشكل منفصل في الشكل المطلوب الأماكن على الصفحة. الجداول التي ينظر إليها الشخص على أنها مجموعة كاملة من الخلايا، بالنسبة لتطبيق يعرض ملف PDF، هي مجرد مجموعة فوضوية من الرموز والخطوط التي، عن طريق الصدفة، شكلت شيئًا يراه الشخص على أنه جدول. تختفي الارتباطات التشعبية، التي يمكن استخدامها في المستند الأصلي للتنقل داخل المستند وللذهاب إلى عناوين الويب، كوسيلة للتنقل عند طباعتها، تاركة فقط النقوش الملونة و/أو التي تحتها خط. بشكل عام، التقليد الكامل والخداع. أدناه سأطلق على ملفات PDF هذه اسم "المتجه" (حيث تتكون من أوامر متجهة، والتي تتضمن أحرف الرسم).

هناك طريقة أخرى للحصول على مستندات PDF، والتي أصبحت شائعة بشكل خاص في السنوات الأخيرة، وهي تحويل الصفحات الورقية الممسوحة ضوئيًا إليها. في الوقت الحاضر، يمكن لمعظم الماسحات الضوئية والأجهزة متعددة الوظائف إنتاج نتائج في شكل ملفات PDF "النقطية" - في هذه الحالة، ليست هناك حاجة إلى الطريقة السابقة "لمحاكاة الطباعة"، ويقوم برنامج تشغيل الجهاز أو الأداة المساعدة بشكل مستقل بإنشاء صفحات PDF بحيث يمكن لكل منها يحتوي على الصورة "النقطية" المطلوبة، ولحسن الحظ، فإن مجموعة تنسيقات الرسومات التي يمكن استخدامها في PDF تغطي معظم الطلبات. تشغل مستندات PDF "النقطية" هذه مساحة أكبر ويبدو أنها ذات جودة أقل من تلك "المتجهة".

يمكن لبعض التطبيقات الحديثة (بما في ذلك تطبيقات مجموعة OpenOffice والإصدارات الجديدة من Microsoft Office وABBYY FineReader وABBYY PDF Transformer) إنشاء ملف PDF بشكل مستقل، باستخدام ترسانة من الأدوات أكبر بكثير من طابعات PDF، لأنها تعرف الكثير عن المستند المصدر أكثر مما تحتاج إليه ليتم إرسالها إلى الطابعة. يتيح لك هذا، على سبيل المثال، حفظ الارتباطات التشعبية في حد ذاتها (وليس فقط كنص ملون و/أو تحته خط) أو وصف بعض عناصر بنية المستند لإعادة تنسيقها وعرضها على الشاشات الصغيرة. تُسمى هذه المستندات التي تحتوي على معلومات هيكلية بـ PDF "الموسوم" أو "الموسوم". وفقًا لشركة Adobe، فإن "وضع العلامات" الذي تمت إضافته بدءًا من Acrobat 5 مصمم لإخفاء العيوب الأكثر وضوحًا في الإصدارات السابقة من PDF. على سبيل المثال، بالنسبة للمستندات غير المميزة، لا يتم ضمان التشغيل الصحيح لآلية نسخ أجزاء النص إلى حافظة Windows (النسخ واللصق المألوف). علاوة على ذلك، حتى اليوم، لا يتم وضع علامة على جميع ملفات PDF التي تم إنشاؤها، بما في ذلك بسبب الإمكانيات المحدودة لبرامج المولد (أو عدم معرفة المستخدمين مكان تمكين مربع الاختيار الضروري لهذا في الإعدادات)، أو ببساطة بسبب الحجم الأكبر لملفات PDF هذه، عندما يكون الأمر ملحًا، فإن مسألة توفير مساحة القرص عند تخزين الأرشيفات الكبيرة.

تحويل مستندات PDF إلى صيغ أخرى
تنشأ الرغبة في تحرير محتويات مستند PDF أو تحويله إلى تنسيقات أخرى، ويفضل أن تكون قابلة للتحرير (إما للتحرير الفوري أو للتخزين وقابلة للبحث/التحرير "يومًا ما") لأسباب مختلفة. يتم توفير أبسط وسيلة لاستخراج محتوى النص من خلال أي تطبيق يعرض ملف PDF - لدي طريقة النسخ واللصق المعتادة، والتي تعمل بشكل بدائي تمامًا - كقاعدة عامة، يتم فقدان تنسيق الأحرف والفقرات، ويتم تجاهل الجداول والتخطيط المعقد لمستند PDF . هناك تطبيقات تتيح لك "التحرير الموضعي" لملفات PDF دون التحويل إلى تنسيقات أخرى - ولكن ترسانة أدوات التحرير الخاصة بها محدودة للغاية، حسنًا، لا توجد مقارنة مع معالجات النصوص التقليدية :) في Adobe Acrobat باهظ الثمن، بالنسبة للعديد من المستندات نوع التحرير الوحيد الذي يعمل به هو "التعليق التوضيحي" - هناك أدوات لإضافة التعليقات، وتمييز النص بعلامة، وشطب النص، وما إلى ذلك. نعم، يبدو أن هناك تحريرًا أكثر تقدمًا، ولكن بالصدفة لم تصادف الرسالة المضحكة "كل التحديد أو جزء منه لا يحتوي على خط نظام متاح. لا يمكنك إضافة نص أو حذفه باستخدام الخط المحدد حاليًا." عندما تحاول ببراءة إزالة حرف أو كلمة من مستند PDF "جميل" و"متجه" في Acrobat؟ هل حاولت استبدال جزء من السطر بجزء أطول، مع الأسف تشاهد ذيل السطور يزحف إلى اليمين؟ إذا لم يكن الأمر كذلك، فإن حبك لمنتجات Adobe لم يأت بعد! مهام بسيطة ومألوفة لمعالجات النصوص - على سبيل المثال، "استبدال كلمة "MS" بكلمة "Microsoft" في المستند بأكمله في بضع ثوانٍ، وتغيير موضع النص في الأعمدة والصفحات" - مثل هذا "التحرير" ليس قريبًا حتى .

ليس من قبيل الصدفة أن تكون صناعة كاملة قد تشكلت في صناعة البرمجيات لإنتاج أدوات تحويل ذات وظائف أفضل. مما هو مكتوب أعلاه (وخاصة أدناه) يجب أن يتضح مدى صعوبة هذه المهمة. معظم المستخدمين الذين لم يقرؤوا هذا التصميم لا يعتقدون ذلك - ولهذا السبب أكتبه :)

المشاكل الرئيسية عند تحويل PDF إلى صيغ أخرى
غالبًا ما يُستخدم مفهوم "طبقة النص" في المناقشات المتعلقة بالقضايا المتعلقة بملف PDF. بشكل حدسي، يفترض العديد من المستخدمين أن ملفات PDF تحتوي على أجزاء مخصصة تصف بشكل منطقي وواضح جميع الخصائص الضرورية للنص المرئي - أو النص غير المرئي، ولكن يمكن العثور عليها عن طريق البحث أو تمييزها بالماوس. أريد أن أخبرك بسر رهيب (ربما مع خطر الحصول على رصاصة في المستقبل القريب من قاتل أرسله مؤلفو تنسيق PDF وقسم التسويق الخاص بهم) - لا توجد طبقة نصية بالمعنى المحدد في PDF! في الواقع، يوجد لكل صفحة تدفق عام لأوامر رسمها، حيث يتم خلط أنواع مختلفة من الأوامر بشكل عشوائي تمامًا - تحديد مناطق القطع، وتغيير سمك الخطوط المنقطة ولونها ونمطها الحالي، وتغيير نظام الإحداثيات، وتغيير الخط، ورسم خطوط مستقيمة ومنحنيات (بالسمات الحالية)، وإخراج مجموعة من الأحرف ذات السمات الحالية و"أرقام الحروف الرسومية" المحددة (الحرف الرسومي هو وصف لصورة الرمز، دون مراعاة خصائصه الأخرى)، وإخراج الصور النقطية، الخ. وهذا يعني أنه حتى الأوامر النصية الخاصة هي مجرد واحدة من العديد من أدوات الرسم، وليست مقسمة إلى سلاسل منفصلة.

والأمر الأسوأ هو أنه حتى داخل صفحة PDF واحدة، يمكنك استخدام مجموعة واسعة جدًا من الوسائل لتصوير نص يشبه العين: يمكن أن تكون الحروف مرئية كأجزاء من صورة نقطية - على سبيل المثال، في الشعارات (مهمة يعد التعرف عليها مهمة محضة لتطبيقات التعرف الضوئي على الحروف، على سبيل المثال ABBYY FineReader)، نتيجة للرسم باستخدام منحنيات Bezier أو أوامر نصية خاصة. هذه الحالة الأخيرة هي الأفضل للمعالجة، ولكن حتى هنا لا تتم الإشارة بالضرورة إلى رموز الأحرف المقبولة عمومًا من Unicode أو الترميزات الأخرى - لأنه يمكن كتابة الخطوط الخاصة من مجموعة فرعية من الأحرف المستخدمة فعليًا فقط في ملف PDF ويمكن كتابة الأحرف يمكن الرجوع إليها من خلال "أرقام رسومية" عشوائية تمامًا، وليس من خلال الرموز. أي أنه ليس من السهل دائمًا اكتشاف الرموز في المكان المناسب وتحديد رموزها! مع التنسيق، بما في ذلك اختيار خط مماثل في حالة عدم وجود تماثلي دقيق، لا يزال الأمر أكثر صعوبة.

الرموز، حتى لو تم تأسيس وجودها ورموزها بطريقة أو بأخرى، في ترتيب عرضها على الصفحة في كثير من الأحيان لا تتوافق بأي شكل من الأشكال مع التسلسل الأصلي لوضعها وقراءتها على الصفحة. على سبيل المثال، في صفحة مكونة من عمودين، يمكن خلط أوامر إخراج النص من العمودين الأيمن والأيسر بشكل عشوائي. في مثل هذه الصفحة، تحتاج إلى تسليط الضوء على المناطق، كل منها يحتوي على نص متماسك منطقيا - وهذه أيضا مهمة تم حلها بواسطة تطبيقات التعرف الضوئي على الحروف لسنوات عديدة. توفر المعلومات الهيكلية من ملفات PDF ذات العلامات بعض المساعدة - ولكن في كثير من الأحيان حتى في ملفات PDF التي يتم إنشاؤها اليوم، تكون هذه المعلومات إما مفقودة - كما هو الحال عند الإخراج من خلال طابعة PDF - أو ليست كاملة بما فيه الكفاية.

عندما قررنا أنه يوجد نص متماسك في بعض الأماكن على الصفحة (وفي مكان ما فهمنا كيفية تجميعه في جداول - هذه مهمة غير تافهة للغاية!) تحتاج إلى تحويل هذه السطور إلى فقرات وعناصر ذات مستوى أعلى مألوفة لمستخدمي معالجات النصوص وHTML - الأعمدة والجداول والإطارات. عادة لا توجد بيانات حول تنسيق الفقرة في PDF، لذلك يجب أيضًا حساب كل هذه الخصائص - كما هو الحال مع نفس التعرف. إذا حاولت تجاهل عناصر النص الأكثر تعقيدًا من الأسطر أو الفقرات، فمن خلال عرض كل شيء في إطارات قصيرة، ستحصل على مستند يبدو وكأنه الشيء الحقيقي، ولكنه غير قابل للتحرير تقريبًا - تذكر مهمة استبدال الكلمة "MS" مع "Microsoft" في جميع أنحاء المستند؟ هذا اختبار جيد جدًا لقابلية التحرير. بالنسبة للمستند الذي تم تحريره، تعد قدرة النص على التدفق من منطقة إلى أخرى أمرًا مهمًا - في الحالات الضرورية، والتي لا تزال بحاجة إلى التمييز عن الحالات غير الضرورية.
اضف اشارة