ফাইল এন্ট্রপি কী

ফাইল এন্ট্রপি কী
ফাইল এন্ট্রপি কী

ভিডিও: ফাইল এন্ট্রপি কী

ভিডিও: ফাইল এন্ট্রপি কী
ভিডিও: 09. Entropy | এনট্রপি | OnnoRokom Pathshala 2024, নভেম্বর
Anonim

যে কোনও কম্পিউটার ফাইল বাইট নিয়ে গঠিত। একটি বাইট 0 থেকে 255 পর্যন্ত মান নিতে পারে Information

ফাইল এন্ট্রপি কী
ফাইল এন্ট্রপি কী

আপনি হিস্টোগ্রাম ব্যবহার করে এন্ট্রপির ডিগ্রিটি দৃশ্যত মূল্যায়ন করতে পারেন - কোনও ফাইলে একই বাইটগুলি পুনরাবৃত্তি করার সম্ভাবনার বন্টন। ফাইলটির এন্ট্রপি থেকে, আমরা অনুমান করতে পারি যে কোন ধরণের ফাইলটি আমাদের সামনে রয়েছে কেবল তার হিস্টোগ্রাম দেখে seeing

প্রদর্শনের জন্য, আসুন বিভিন্ন ধরণের তিনটি ফাইল নেওয়া যাক এবং তাদের হিস্টোগ্রামগুলি তুলনা করুন। প্রথমটি একটি পাঠ্য ফাইল হতে হবে (*. TXT)। এর হিস্টোগ্রাম চিত্রে দেখানো হয়েছে:

гистограмма=
гистограмма=

পাঠ্য ফাইলটিতে কেবল পাঠ্য থাকে। পাঠ্যের প্রতিটি অক্ষর এনকোডিং সারণী অনুসারে নির্দিষ্ট বাইটগুলির সাথে এনকোড করা হয়। যদিও প্রচুর সংখ্যক এনকোডিং প্রকার রয়েছে, তবে এটি স্পষ্টতই যে সীমিত সংখ্যক বর্ণমালা রয়েছে যা সাধারণত 255 এরও কম থাকে Therefore সুতরাং, কেবলমাত্র কয়েকটি অঞ্চল প্রথম হিস্টোগ্রামে দখল করা হয়, এবং কিছু বাইটগুলি মোটেও হয় না।

নিম্নলিখিত ফাইলটি পিডিএফ ফর্ম্যাটে থাকবে:

гистограмма=
гистограмма=

এই ফাইলটিতে সমস্ত সম্ভাব্য বাইট রয়েছে, কারণ পিডিএফ পাঠ্য ফাইল থেকে আলাদাভাবে এনকোড করা হয়েছে। এটি প্রচুর পরিষেবা তথ্য সঞ্চয় করে: ফর্ম্যাটিং, ফন্ট, চিত্র ইত্যাদি etc. তবে এর হিস্টোগ্রাম দেখায় যে কিছু বাইট প্রায় সমান সম্ভাবনার সাথে ঘটে, অন্যরা - অন্যদের তুলনায় অনেক বেশি। অতএব হিস্টোগ্রামে একাধিক তীব্র ফেটে যায় এবং সাধারণভাবে এটির পরিবর্তে "র‌্যাগড" চেহারা রয়েছে, যদিও এটি পুরো উপলব্ধ প্রস্থটি দখল করে।

এবং শেষ ফাইলটি 7 জেড ফরমেটে জিপ করা হয়েছে:

гистограмма=
гистограмма=

এই হিস্টোগ্রামের দুটি প্রধান বৈশিষ্ট্য রয়েছে: প্রথমত, সমস্ত বাইটগুলি কমবেশি সমান সম্ভাবনা (মোটামুটি সমতল শীর্ষ প্রান্ত) সহ জিপ করা ফাইলটিতে পাওয়া যায় এবং দ্বিতীয়ত, হিস্টগ্রামের উপরে কার্যত কোনও মুক্ত স্থান নেই যা প্রায় সম্পূর্ণ অনুপস্থিতি নির্দেশ করে indicates অপ্রয়োজনীয় যেমন একটি ফাইল। সুতরাং, আমরা উপসংহারে পৌঁছাতে পারি যে প্রত্নতাকারীর অ্যালগোরিদম তাদের সর্বাধিক ইউনিফর্ম বিতরণ অর্জনের জন্য কোনও বিশেষ উপায়ে ফাইলের বাইটগুলিকে "মিশ্রিত" করে।

সুতরাং, পদার্থবিজ্ঞানের মতো কম্পিউটার বিজ্ঞানে এনট্রপি হ'ল সিস্টেমের ব্যাধি একটি পরিমাপ, এই ক্ষেত্রে ফাইলটিতে বাইট বিতরণের ক্ষেত্রে ব্যাঘাত ঘটে। এন্ট্রপি আপনাকে ফাইলের সংকোচনের ডিগ্রি এবং - অপ্রত্যক্ষভাবে - এর ধরণের সম্পর্কে বিচার করতে দেয়।

প্রস্তাবিত: