Programming-for-Bioscience

অধ্যায় ২: ডেটা স্ট্রাকচার শেখা (Learning Data Structures in R)

প্রতিটি প্রোগ্রামিং এর মত R এও ডেটা কে সংরক্ষণ করার জন্য বিভিন্ন পদ্ধতি রয়েছে। যার মাধ্যমে সংরক্ষণ করা হয় তাকে বলা হয় ডেটা স্ট্রাকচার। জীববিজ্ঞান এ আমরা বিভিন্ন রকম ডেটা নিয়ে কাজ করি, যেমন, জিনের সংখ্যা, সেল এর সংখ্যা, বিভিন্ন Sequence ডেটা, GWAS ডেটা, বিভিন্ন বৈশিষ্ট্যের ডেটা। এগুলা ছাড়াও বর্তমানে জিন এর এক্সপ্রেষণ ডেটা যেমন RNAseq, Single Cell RNAseq, VDJseq, CITEseq, ATACseq ডেটা খুবই জনপ্রিয় এবং অনেক রকম গবেষণায় ব্যাবহার হচ্ছে। আরেকটি দিক হচ্ছে Population Health গবেষণায় বিভিন্ন Biobank যেখানে অনেক রুগীর বিভিন্ন diagnostic ডেটা থেকে শুরু করে physiochemical বৈশিষ্ট্যসহ অনেক ডেটা একসাথে রাখা হচ্ছে। বর্তমানে অনেক গবেষণায় এই বড় ডেটা ব্যাবহার করে মডেল বানানো হচ্ছে, ভবিষ্যতে কোভিড এর মত মহামারি এর পূর্বাভাসসহ করনীয় এসব কাজ করা হচ্ছে। এখন যেহেতু আপনাদের কে এসব ডেটা কেন সংরক্ষণ করে রাখা হচ্ছে তার ছোট নমুনা বললাম, সেহেতু আমরা এখন ডেটা সংরক্ষণ করার পদ্ধতি নিয়ে আলোচনা করি। R এ ডেটা স্ট্রাকচার এর মধ্যে পরে ভেক্টর (Vectors), ম্যাট্রিক্স (Matrices), ডেটা ফ্রেম (Data Frames) এবং লিস্ট (Lists)। আমরা এখন কিভাবে জীববিজ্ঞান সম্পর্কিত ডেটায় এই স্ট্রাকচারগুলো ব্যবহার করা যায়, তা ব্যাখ্যা করব।

আপডেট পাওয়ার জন্য নিবন্ধন করুন (Register for Updates)

আপনি যদি এই ব্লগের নিয়মিত আপডেট পেতে চান, তাহলে নিচের ফর্মটি পূরণ করুন। আমি নতুন কোনো কন্টেন্ট যোগ করার সাথে সাথেই আপনাকে ইমেইলের মাধ্যমে জানিয়ে দেব।

ফর্ম পূরণ করতে এখানে ক্লিক করুন