কীভাবে পার্সার তৈরি করবেন

সুচিপত্র:

কীভাবে পার্সার তৈরি করবেন
কীভাবে পার্সার তৈরি করবেন

ভিডিও: কীভাবে পার্সার তৈরি করবেন

ভিডিও: কীভাবে পার্সার তৈরি করবেন
ভিডিও: ধান চাষে ইউরিয়া সার প্রয়োগের সঠিক পদ্ধতি - KTV Bangladesh 2024, এপ্রিল
Anonim

পার্সিং ওয়েব পৃষ্ঠা প্রোগ্রামিংয়ের অন্যতম ব্যবহৃত কৌশল। প্রয়োজনীয় স্ক্রিপ্টটি নিজে লেখার কোনও উপায় না থাকলে এটি সহজে এবং সহজভাবে আপনাকে অল্প সংখ্যক কমান্ড ব্যবহার করে সাইটে প্রয়োজনীয় পরিষেবাটি পাওয়ার অনুমতি দেয়।

কীভাবে পার্সার তৈরি করবেন
কীভাবে পার্সার তৈরি করবেন

নির্দেশনা

ধাপ 1

পার্স করার সহজ উপায় হ'ল পিএইচপি ফাংশন ফাইল_জেট_কন্টেন্টস ()। এটি আপনাকে পাঠ্য স্ট্রিং হিসাবে কোনও ফাইলের বিষয়বস্তু পেতে সহায়তা করে। ফাংশনটি "মেমরি ম্যাপিং" অ্যালগরিদম ব্যবহার করে, যা এর কার্যকারিতা উন্নত করে।

ধাপ ২

উদাহরণস্বরূপ, কোনও স্ক্রিপ্ট লিখতে যা রাশিয়ান ফেডারেশনের কেন্দ্রীয় ব্যাংকের কোনও ওয়েবসাইট থেকে ডেটা পার্স করে, আপনাকে সাইটের জন্য উপযুক্ত ফর্ম্যাটে তারিখটি পূর্বে সংজ্ঞায়িত করে উপযুক্ত ফাংশন ব্যবহার করে একটি এক্সএমএল পৃষ্ঠার সামগ্রী পেতে হবে, এবং তারপরে এটি ভাগ করার জন্য নিয়মিত এক্সপ্রেশন ব্যবহার করে। নির্বাচিত মুদ্রা প্রদর্শনের জন্য, ব্যাঙ্কের ওয়েবসাইট থেকে প্রাপ্ত কোডটি ব্যবহার করা হয়: $ তথ্য = তারিখ ("d / m / Y"); $ = ফাইল_জেট_কন্টেন্টস (https://www.cbr.ru/scriptts/XML_daily.asp ? তারিখ_আরক = $ ডেটা); প্রিগ_ম্যাচ ("/(.*?)/" ", $ পেতে, $ স্ট্রিং); প্রিগ_ম্যাচ (" /(.*?)/ ", $ স্ট্রিং [1], $ স্ট্র);

ধাপ 3

আপনি যদি এক্সএমএল ফাইলটি নিজেই বিশ্লেষণ করতে চান তবে এর জন্যও এখানে সম্পর্কিত ফাংশন রয়েছে। পার্সার শুরু করতে, আপনাকে এটি xML_parser_create ব্যবহার করে আরম্ভ করতে হবে: ars পার্সার = xML_parser_create ();

পদক্ষেপ 4

তারপরে ক্রিয়াকলাপগুলির একটি তালিকা নির্দিষ্ট করা হয়েছে যা সংশ্লিষ্ট ট্যাগ এবং পাঠ্য তথ্যের প্রসেস করবে। সংশ্লিষ্ট এক্সএমএল উপাদান শুরু এবং শেষ হ্যান্ডলারগুলি সেট করা হয়েছে: xML_set_element_handler (ars পার্সার, "স্টার্টমেন্ট", "এন্ড এলিমেন্ট");

পদক্ষেপ 5

উপযুক্ত লুপের মধ্যে স্ট্যান্ডার্ড fopen () এবং fgets () ফাংশন ব্যবহার করে ডেটা পড়া যায়। ফাইলগুলির বিষয়বস্তুগুলি xML_parse () এ লাইনে লাইন ফিরে আসে। সর্বশেষ প্যারামিটারে সর্বশেষ লাইনটি পড়ার পতাকা রয়েছে: যখন ($ সামগ্রী = fgets ($ fparse)) {

যদি (! xML_parse ($ পার্সার, $ বিষয়বস্তু, ফেফ ($ fparse))) {

প্রতিধ্বনি “ত্রুটি”;

বিরতি; }}

পদক্ষেপ 6

XML_parser_free () ফাংশনটি সিস্টেম দ্বারা দখল করা সংস্থানগুলি মুক্ত করতে ব্যবহৃত হয়। এক্সএমএল ফাইলগুলি প্রক্রিয়া করার সময় এই ফাংশনগুলি সবচেয়ে শক্তিশালী।

প্রস্তাবিত: