التخطي إلى المحتوى الرئيسي

فكرة مبدأية عن ضغط الملفات


ضغط الملفات من العمليات المهمة لتقليل حجم المفات ولها مزايا عديدة من اهما توفير المساحة على الهاردديسك فى حالة ارشفة الملفات القديمة الغير مستخدمة حاليا وتحويل عدد كبير من الملفات فى ملف واحد والاستخدام الشائع لضغط الملفات يكون فى تبادل الملفات عبر الانترنت وذلك لضمان تحميل او رفع اسرع للملفات .

دائما ما نستخدم برامج مختلفة دون تحديد لماذا نستخدم هذا البرنامج او ذاك , والسبب فى ذلك يعد الى ضعف معرفة المستخدم العربى بكيفية الاستفادة من ضغط الملفات , فبداية يجب ان نعرف مثال توضيحى بسيط لكيفية ضغط الملفات كالتالى :

اذا افترضنا اننا نريد ضغط ملف نصى مكتب فية هذه الجملة 
" العلم هو السلاح و العلم هو التقدم . القوة هى العلم و القوة لا تأتى بدون العلم"
الجملة تتكون من 16 كلمة وهى عبارة عن 61 حرف و15 مسافة , وفكرة عمل برامج الضغط تعتمد على جمع التشابهه فى الملف وترقيمة ووضع قاموس Dictionary  ليشرح معنى الترقيم مرة واحدة فقط لكل كلمة او حرف كما هو اتى :
ترقيم الكلمات المتشابه :
كلمة "العلم" ظهرت 4 مرات ولنفرض انها ستكون رقم 1
كلمة "هو" ظهرت مرتان ولنفرض انها ستكون رقم  2
كلمة "و" ظهرت مرتان ولنفرض انها ستكون رقم3
كلمة "القوة" ظهرت مرتان ولنفرض انها ستكون رقم4 
سيكون هذا شكل الجملة بعد الضغط 
"1 2 السلاح 3 1 2 التقدم . 4 هى 1 3 4 لا تأتى بدون 1"
الان اصبحت الجمله تتون من 35 حرف بدلا من 61 حرف وهذا يعنى ان حجم الملف سكون حوالى 57.3% من اجمالى حجمة الاصلى , ولكن ليست هذه هى القاعدة الوحيدة فى اسلوب جمع التشابه فهناك ايضا المسافات بين الاحرف من الممكن تسجيل الكلمة بالمسافة قبلها وبعدها ككلمة واحدة كمثال كلمة العلم يمكن ان تسجل برقمين 5 و 6 مقابل المعنى5= "العلم + المسافة"  و 6 "المسافة+ العلم +المسافة" هذا سيقلص حجم المسافات بين الاحرف .


قد يتضح للقارئ ان العملية سهلة جدا ولكن البرنامج يعمل على نحو معقد جدا يستند الى قواعد رياضية معقدة ولوغريتمات معينة , ولكن فى هذا المقال اوضح فقط معلومة عامة مبسطة عن طريقة ضغط الملفات .

لكن هذه الضغط يكون مؤثر بشكل عالى جدا مع الملفات النصية او المكتوبة لتكرار الاحرف والكلمات فيها بشكل مستمر لكن هناك ملفات لا يمكن ضغطها بهذه الدرجة كملفات الصور والفيديو والصوت وذلك يعود لعدم وجود تشابه يذكر فى تفاصيل الملف.
فعلى سبيل المثال نريد ضغط صورة تحمل صورة سماء زرقاء ومياة البحر ايضا زرقاء ونكتشف فى النهاية ان نسبة الضغط لم تتعدى 0.5% والسبب فى ذلك ان ملفات الصورة تكون تفاصيلها عبارة عن ما يسمى بالبكسيل Pixlel  وهى نقطة لها لون محدد  ويتم رسم الصورة بالكامل من خلال تجميع البكسيل جنبا الى جنب .. فاذا اخذنا مثلا لون السماء الازرق , فان كل بكسيل يحمل فعلا اللون الازرق ولكن كل بكسيل يحمل درجة من درجات الازرق وهذا ما يجعل التشابه صعب .. ولكن يوجد هناك طرق اخرى لضغط هذه الصور ببرامج اخرى تعمل على تقليل دقة الصورة وذلك يقلل عدد البيكسل وايضا نفس الفكرة فى ملفات الفيديو والصوت لكن هذه البرامج لا تضمن اعادة جودة الصورة مرة اخرى كما هو الحال فى الضغط العادى  .

طبعا اشهر برامج الضغط المستخدمة منها Winrar / WinZip هناك برامج مفتوحة المصدر وتتميز بلوغريتمات متطورة كـ 7-zip  وهى اختيارى الشخصى حتى الان .

من اهم الاشياء التى يجب مراعتها عند فك ضغط ملف او ضغطة هو معرفة حجم القاموس المستخدم وكما ذكرنا سابقا القاموس هو الاداة التى يتم كتابة فيها معانى الارقام مقابل الكلمات او البيانات المتشابهه داخل المفات وطبعا كلما زاد حجم القاموس ازدادت نسبة الضغط نسبيا ولن يزداد الزمن اللازم لضغط الملف .

فى بعض الاحيان نصادف ملفات بحجم صغير جدا ولكن اصلها كبير كمثال لعبة بحجم اصلى 2.5 جيجا تكون مضغوطة فى حجم 350 ميجا , اى ما يصل الى 12% من حجمها الاصلى .. قد يكون تم ضغط هذا الملف بقاموس بمساحة كبيرة ولتكن 512 ميجا .. هذا يعنى انك تحتاج لمساحة فارغة فى ال RAM اكبر من 512 لفك هذا الملف وهناك ما بتطلب مساحات على الرام اكبر من هذا وايضاً اذا اردت ضغط ملف ما لاقصى درجة من الممكن رفع حجم القاموس اذا كان ذلك متاح فى البرنامج المستخدم ولكن كرأى شخصى لا حاجة للمستخدم العادى فى استخدام قاموس كبير الحجم للضغط خاصة ان هذا قد يجعلك تنتظر اكثر من يوم كامل لضغط ملفات بحجم 2 جيجا مثلا . 

وفى الصورة التالية استهلاك الرامة لبرنامج 7-zip  اثناء ضغط ملف بقاموس كبير نسبياً 64 ميجا يحتاج الى ما يقارب 700 ميجا  من ال RAM
 
واهم ما يميز برامج الضغط بعضها البعض هو اللوغريتمات المستخدمة فى ضغط الملفات كمثال لوغريتمات LZMA / PPMd / BZIP2 وايضاً الخصائص المتاحة فى البرنامج المستخدم .
لاختيار برنامج مناسب لاستخدامك يجب اتباع مبدأين فقط , الاول ما هو الاهم لك عامل الوقت ام الثانى وهو عامل حجم الملف .. اذا كنت ترجح عامل الوقت فالافضل سيكون Winrar اما اذا كنت تهتم بعامل حجم الملف فاستخدم UHARC او 7-zip   ومع المتابعة للمقارنات بين نتائج الاحصائيات على برامج اخرى من خلال الانترنت قد تستطيع تحديد ما تحتاج من خلال المعلومات الاساسية السابقة .
 
هذا المقال يعتمد على الفكرة العامة فقط دون الدخول الى التفاصيل الدقيقة .. اذا كنت تريد تفاصيل اكثر دقة لا تتوقف عند هذا المقال واكمل البحث .
اذا كان هناك اى خطأ فى اى من المعلومات السابقة برجاء التوضيح فى التعليقات او المراسلة 

تعليقات

إرسال تعليق

المشاركات الشائعة من هذه المدونة

كيف يفهم الكمبيوتر اوامر البشر ؟ لغة الآلة (0-1) !

يوميا نستخدم اجهزة الكترونية كالكمبيوتر والتلفيون المحمول والتلفزيون والكاميرات الرقمية , ولكن لم نسأل انفسنا كيف تفهم الاله اوامرنا نحن البشر؟ , اذا كانت تلك الاجهزة يسرى بداخلها كهرباء فقط لاشئ اخر , كيف تتنتج لنا تلك الاشياء والمعلومات التى نفهمها كالعمليات الحسابية او الموسيقى او ملفات النصوص او الفيديو .. الخ , والاجدر بالاهتمام هو جهاز الكمبيوتر ذلك العملاق الصغير الذى يستطيع تنفيذ ملايين العمليات الحسابية فى ثوانى معدودة والاحتفاظ بمعلومات مختلفة فى شتى المجالات دون اخطاء تذكر , ودائما ما نعرف ان لغة الكمبيوتر هى رقمى الصفر (0) والواحد (1) فقط ولكن لا نعرف ماذا تعنى هذه الارقام !!! . لمعرفة كيف يفهم الكمبيوتر البشر , يجب ان نعرف ماذا تعنى الكهرباء لنا اولا , الكهرباء هى عبارة عن طاقة محررة متكونة من  سيل من الالكترونيات يسمى الشحنة يمر عبر موصلات كالنحاس والحديد وغيرها من المعادن , ونستخدم هذا السيل من الالكترونيات فى تحويل طاقتة الى اشياء يحتاجها البشر كتشغل مصباح لتحول الطاقة لضوء او مروحة لتحول الطاقة لحركة الهواء او تحويل الطاقة لتحريك موتور مياة .. الخ , تتحرك الكهر

الفرق بين كابلات الشبكات CAT 5 / 5E / 6

فى الشبكات المحلية LAN وهى اختصار ل Local Area Net work  او بالعربية شبكة محلية , من الطبيعى ان هناك وسيط لتوصيل هذه الاجهزة ببعضها فنستخدم الكابلات , لكن غالبا ما يحدث ارتباك عند شراء نوعية الكابل بسبب بعض التفاصيل الفنية عن نوعية الكابل المطلوب شرائة ومن اهمها كلمة دائما نسمعها وهى  CAT  ويليها رقم 5 او 5e او 6 وهى المنتشرة حاليا فى مصر . وللاسف الشديد اغلب تجار هذه الكابلات يعرضون على العميل الرقم الاعلىCAT 6 l معللً بذلك ان جودتة اعلى , وعندما يتسائل العميل ما الفرق ؟, قد يخبرة التاجر عن ان هذا السلك اقوى ويتحمل عوامل الحرارة والبرودة او يقنعه ان هذه النوعية مرنة وتتحمل الشد الضغط  .. ولكن فى الواقع كلها مجرد افترضات من التاجر بعضها صحيح ولكن هو يفعل ذلك لبيع المنتج الاعلى سعرا للربح ويصبح العميل دائما ضحية لعدم معرفتة بهذه التفاصيل الفنية . فى البداية يجب معرفة ما معنى كلمة CAT , هى اختصار لكلمة Category وبالعربية تعنى "فئة" وهو رمز يعنى معاير معينة فى الخامات الاساسية التى صنع منها الموصل داخل الكابل وايضا المعايير الكهربية التى يعمل عليها الكابل ووبعض العوامل

توضيح عمل ال Spliter / Filter ADSL

فى الفترة الاخيرة لاحظت اعتقاد خاطئ ومفهوم عابر عن قطعة ال ADSL Spliter التى توضع قبل توصيل خط الانترنت بالروتر , وقد يسأل الكثير عن ما هى وظيفة هذه القطعة بالتحديد فى البداية يجب معرفة بعض الاساسيات , اهمها هى معرفة ان خط التليفون يحمل موجات كهربية بتردد معين تسمى اشارات تناظرية Analog والكمبيوتر يتعامل مع اشارات رقمية فقط تسمى Digital .. فى الصور التالية توضيح للفرق بين الاشارتين المعلومة الثانية كيف يصل الانترنت عبر اسلاك التليفون : الموجة الكهربية داخل سلك التليفون تكون لها تردد معين يكون عادة يكون منخفض وتكن لة استطاعة على حمل اصوات البشر بطرق هندسية معينة , فى حال التعاقد مع شركة انترنت تقوم الشركة باضافة تردد اخر فى نفس السلك لكن بتردد عالى جدا ليستطيع حمل معلومات الانترنت والاصوات والفيديو .. الصورة التالية توضح الفرق بين التردد المنخفض والعالى  الترددات الحقيقة تكون داخل سلك التليفون فى حالة وجود الانترنت تكون عبارة عن خليط بين الترددات السابقة (المنخفضة + العالية ) وتكون بالشكل التالى :  اللون الاخضر هو تردد التليفون العادى .. اللون الاحمر هو تردد الانترنت