আসসালামু আলাইকুম । আশা করি সকলে ভালো আছেন । আমিও আলহামদুলিল্লাহ আপনাদের দোয়ায় অনেক ভালো আছি।
বরাবরের মতো আজকেও হাজির হলাম নতুন কিছু নিয়ে।
উপরে টাইটেল দেখে হয়তো বুঝতে পারছেন আজকে টপিক কি? সংক্ষিপ্ত করে বলি ,যে কোন ওয়েবসাইটের সকল মেইল এবং নাম্বার বের করুন কয়েক সেকেন্ডে। তার আগে আমাদের জানতে হবে ওয়েব স্কোপ কি?
Webscrape কি?
webscrape হচ্ছে ওয়েবসাইটের ডাটা extract করা। সেটা হতে পারে video ,Image, Email, Number , Text ইত্যাদি ।
Scrape হচ্ছে একটি framework যেটা দিয়ে ওয়েবস্কোপিং করা হয়।
Webscraping কত প্রকার?
ওয়েবস্কোপিং ৫ প্রকার এবং সেগুলো হচ্ছে :
- Spiders
- Pipelines
- Middlewares
- Engine
- Schedule
এই ৫ প্রকার স্কোপিং নিয়ে আর আলোচনা করছি না আপনারা একটু গুগল করলেই পেয়ে যাবেন।
Webscrape কারা ব্যবহার করে?
ওয়েবস্কোপি মূলত যারা freelance এবং Data Entry নিয়ে কাজ করে তারা বেশি ব্যবহার করে থাকে। তাছাড়া কোন ওয়েবসাইটে সাহায্যের জন্য কোন মেইল করা দরকার হলে তখন প্রত্যেক পেইজে না গিয়ে ওয়েবস্কোপি করে তাদের নাম্বার মেইল বের করা হয় ।
এই স্কোপিং মূলত একটা সফটওয়্যার। যেটা কিনা কম্পিউটারের জন্য তৈরি করা হয়েছে। কিন্তু আজকে আমরা শিখবো কিভাবে android ফোন দিয়ে ওয়েবস্কোপিং করা যায়।
প্রথমে আমরা termux কে আপডেট করে নিবো।
pkg update -y
Termux কে আপগ্রেড করে নিবো।
pkg upgrade – y
গিটহাব থেকে টুলসটি ডাউনলোড করবো।
git clone https://github.com/3xploitGuy/webscrape.git
ডাউনলোড শেষ হলে ls দিবো।
তারপর টুলসটি ভিতরে প্রবেশ করবো।
cd webscrape
মেইন ফাইলটিকে পারমিশন দিবো।
chmod +x webscrape.sh
টুলসটি রান করো।
bash webscrape.sh
এখানে আপনি যেই ওয়েবসাইটের মেইল এবং নাম্বার জানতে চাচ্ছেন সেই ওয়েবসাইটের ঠিকানা দিবেন।
অবশ্যই আপনাকে https:// দিতে হবে।
যদি ওয়েবসাইটের মেইল দেখতে চান তাহলে y দিবেন। একই ভাবে নাম্বার দেখতে চাইলে দিবেন।
দেখতে পাচ্ছেন একটা ওয়েবসাইটের নাম্বার এবং মেইল পেয়ে গেলাম।
আপনি যদি মেইল এবং নাম্বার ফোনের ফাইল হিসাবে সেইভ করতে চান তাহলে y দিবেন।
তারপর আপনি কোথায় রাখবেন সেই লোকেশন দিবেন।
দেখতে পাচ্ছেন সেইভ হয়ে গেছে।
তো আজ এই পর্যন্তই ভালো থাকবেন সুস্থ থাকবেন ।যদি কোন সমস্যা হয় তাহলে টেলিগ্রাম না ফেইসবুকে নক দিতে পারেন।