
Also known as source coding, bit-rate reduction, compression
process of encoding information using fewer bits than the original representation
Data compression is a process that encodes information using fewer bits than needed in its original form, making files smaller. This matters because smaller files take up less storage space and travel faster over the internet, saving time and resources.
AI-generated from the Wikipedia summary — may contain errors.
ضغط البيانات أو مصدر الترميز (بالإنجليزية: Data compression) في علوم الحاسوب والمعلومات النظرية، هو عملية تشفير المعلومات حيث تأخذ حيزا قليلا من المساحة. ويوجد العديد من البرامج التي تقوم بضغط البيانات من أشهرها وين زيب. يختلف نوع ما من المقاييس المستخدمة لضغط البيانات الرقمية باختلاف بشكل ملحوظ جدا على نوع الضغط المستخدمة وطريقة التطبيق الذي يتم استخدامه.خوارزميات ضغط ضياع، والتي ترتبط في المقام الأول مع المدرسة القديمة من ضغط المعروفة باسم الجيل الأول الترميز، واستخدام صيغة بسيطة نسبة كما في المعادلة (2.1): ضغط حجم الملف نسبة ضغط =----------------------- (2.1) فتح ضغط حجم الملف المعادلة (2.1) هي في جوهرها ضغط متري نسبة بسيطة مبنية. بغض النظر عن نوع من وسائل الإعلام الرقمية يتم ضغطها (أي الصورة والنص، والصوت، الخ) نسبة ضغط صرح يعطي دلالة واضحة على ضغط تحقيقه.وهناك أنواع عديدة من الطريقة المستخدمة في هذه الأيام لضغط، وكلها لها خصائصها المميزة. نوع الطريقة المستخدمة يملي الانتروبيا من البيانات التي يتم ضغطها. عند اختيار طريقة من المهم أن تعرف ما نوع البيانات التي يتم ضغطها من أجل الحصول على نسبة ضغط الحد الأقصى الممكن. عند استخدام الانتروبي المدى بالتعاون مع الصور الرقمية لا يعني بالضرورة على المعلومات بكسل من الصورة. مؤخرا أصبح من الممكن لتخزين كيف تبدو صورة إدراكيا. عند تطبيق مثل هذا النموذج قد يعني أن الصورة تم تعديل طفيف خلال دورة ضغط / التوسع دون التأثير على الجودة المدركة من جانب المستخدم. هذا هو مفهوم هام كما يراها نموذجا الإدراك الحسي محتوى المعلومات من الصورة لا تكون البيانات بكسل ثنائي مقرها، ولكن كيف يمكن لصورة على أن جهاز تبدو للمستخدم [49]. عندما يجري تنفيذها واختبارها هذا يمكن أن يكون، في بعض الأحيان غير موضوعية جدا، ولكن عند تطبيقها بطريقة سليمة ومدروسة يمكن أن تولد بعض نسب ضغط مذهلة مع تشويه الحد الأدنى من الأصل. ويمكن أن يقال هذه الفكرة لتكون أساس الحقل الجديد من الجيل الثاني ضغط الصورة [41]. خلال الفترة المتبقية من هذه الرسالة سيكون التركيز على تطوير المعلومات الزائدة عن الحاجة من صورة وقت ممكن. مشغولة نموذج أساسا مع إزالة المعلومات الزائدة عن الحاجة، ووضع بيانات الناتج في مثل هذا التنسيق الذي يعتبر مثاليا للالكون تستند الترميز، وتستند جميع النماذج الإحصائية، حتى بعد تطبيق جميع التحويلات الممكنة لتبسيط وتعديل واحد إدخال البيانات لا يزال مطلوب لتوليد الاحتمالات وذلك لتشفير البيانات. يتم تصنيف أساليب الضغط إلى نوعين: * ضغط البيانات غير المنقوص. * ضغط البيانات المنقوص. في مجال معالجة الإشارات الرقمية، يشير مصطلح ضغط البيانات (Data Compression)، أو الترميز المصدري (Source Coding)، أو خفض معدّل البيانات إلى ترميز المعلومات باستخدام قدر أقل من من التمثيل الأصلي. يمكن أن يكون ضغط البيانات إمّا أو ضغط البيانات غير المضيع بالإنجليزية (Lossy) و (Lossless Compression) على الترتيب. يخفض من عدد النبضات الثنائية (البت) اللازمة للتعبير عن البيانات عن طريق التعرف على .ولا تفقد أي معلومات نتيجة لضغط البيانات. ومن أمثلة هذا النوع البرامج التي تستخدم لضغط ملفات الحاسوب مثل برامج ليتم تخزينها في صيغة (*.rar)أو في صيغة (*.zip).ويتم استعادة ملفات الحاسب أيًا كان نوعها بالكامل بعد فك الضغط. أمّا في حالة فيتم تقليل النبضات الثنائية من خلال التعرف على المعلومات غير الهامة أو غير اللازمة وإزالتها. ومن أمثلة هذا النوع ما يحدث عند تخزين الصور ومقاطع الفيديو بصيغ تقلل الحجم، حيث يتم ضغط حجم الملفات عن طريق تقليل جودة الصورة مثلاً بقدر غير محسوس، مثال: تحويلها من صيغة (*.bmp) الكاملة إلى صيغة (*.jpg) المضغوطة. وكذلك الحال عند تحويل صيغة (*.avi) الكاملة إلى صيغ أخرى مثل (*.mp4) المضغوطة. ولا يمكن استرجاع «المعلومات» المفقودة عند الضغط بهذه الأساليب. وتسمى عملية خفض حجم ملف البيانات باسم «ضغط البيانات». أمّا في سياق نقل البيانات وفي أنظمة الاتصالات، فيطلق عليها «ترميز المصدر» (حيث يتم الترميز عند مصدر البيانات قبل تخزينها أو إرسالها) وهذا على العكس من ترميز القناة. والذي يقصد منه تصحيح الأخطاء التي تسببها القناة أثناء الإرسال. يعتبر ضغط البيانات أمرًا مفيدًا نظرًا لأنه يساعد على خفض استخدام الموارد، مثل وسط التخزين أو الإرسال أو حيز التردد. ونظرًا لأن البيانات المضغوطة لابد من فك ضغطها لكي تصبح صالحة للاستخدام، فإن عمليات المعالجة الإضافية هذه تضع قيودًا حسابية أو تكلفة من نوع آخر لعملية فك الضغط، وبالتالي فإن هذه العملية ليست بلا ثمن!. ويتطلب فك ضغط البيانات الموازنة بين الوقت/حيز التخزين من ناحية وبين التعقيد من ناحية أخرى. فعلى سبيل المثال، عند استخدام أحد أساليب ضغط الفيديو، يتطلب الأمر إمّا مكلّفة لكي تتمكن من فك ضغط الفيديو أثناء المشاهدة (وهو ما يزيد التعقيد)، أو أن يتم فك الضغط بالكامل قبل المشاهدة وهو ما يكلِّف وقتًا (في أنظمة الإرسال/الاستقبال) ويتطلب أيضًا حيز تخزين كبير يستوعب الفيديو الذي تم فكّه. ويعتمد تصميم أنظمة ضغط البيانات على الموازنة بين عدة عوامل مختلفة، والتي تشمل درجة الضغط، وكمية التشويه (Distortion) التي يمكن احتمالها (وذلك عند استخدام أنظمة )، وكمية الموارد الحسابية المطلوبة لفك ضغط البيانات. وتجدر الإشارة إلى أن نظرية المعلومات هي العلم الذي يبحث في كلا نوعي ضغط البيانات، كما سيأتي تفصيله لاحقًا، حيث يهدف الضغط غير المنقوص إلى تمثيل البيانات بعدد من النبضات الثنائية يكافئ بالضبط الإنتروبية بينما يؤدي الضغط المنقوص إلى تمثيل البيانات بأقل من الإنتروبية، وبالتالي يحدث فقد في المعلومات (تشويه) وتبحث النظرية حينئذٍ في تحقيق أقصى استفادة مناظرة لهذا التشويه.
via PubMed
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).