প্রতিটি প্রোগ্রামিং এর মত R এও ডেটা কে সংরক্ষণ করার জন্য বিভিন্ন পদ্ধতি রয়েছে। যার মাধ্যমে সংরক্ষণ করা হয় তাকে বলা হয় ডেটা স্ট্রাকচার। জীববিজ্ঞান এ আমরা বিভিন্ন রকম ডেটা নিয়ে কাজ করি, যেমন, জিনের সংখ্যা, সেল এর সংখ্যা, বিভিন্ন Sequence ডেটা, GWAS ডেটা, বিভিন্ন বৈশিষ্ট্যের ডেটা। এগুলা ছাড়াও বর্তমানে জিন এর এক্সপ্রেষণ ডেটা যেমন RNAseq, Single Cell RNAseq, VDJseq, CITEseq, ATACseq ডেটা খুবই জনপ্রিয় এবং অনেক রকম গবেষণায় ব্যাবহার হচ্ছে। আরেকটি দিক হচ্ছে Population Health গবেষণায় বিভিন্ন Biobank যেখানে অনেক রুগীর বিভিন্ন diagnostic ডেটা থেকে শুরু করে physiochemical বৈশিষ্ট্যসহ অনেক ডেটা একসাথে রাখা হচ্ছে। বর্তমানে অনেক গবেষণায় এই বড় ডেটা ব্যাবহার করে মডেল বানানো হচ্ছে, ভবিষ্যতে কোভিড এর মত মহামারি এর পূর্বাভাসসহ করনীয় এসব কাজ করা হচ্ছে। এখন যেহেতু আপনাদের কে এসব ডেটা কেন সংরক্ষণ করে রাখা হচ্ছে তার ছোট নমুনা বললাম, সেহেতু আমরা এখন ডেটা সংরক্ষণ করার পদ্ধতি নিয়ে আলোচনা করি। R এ ডেটা স্ট্রাকচার এর মধ্যে পরে ভেক্টর (Vectors), ম্যাট্রিক্স (Matrices), ডেটা ফ্রেম (Data Frames) এবং লিস্ট (Lists)। আমরা এখন কিভাবে জীববিজ্ঞান সম্পর্কিত ডেটায় এই স্ট্রাকচারগুলো ব্যবহার করা যায়, তা ব্যাখ্যা করব।
আপনি যদি এই ব্লগের নিয়মিত আপডেট পেতে চান, তাহলে নিচের ফর্মটি পূরণ করুন। আমি নতুন কোনো কন্টেন্ট যোগ করার সাথে সাথেই আপনাকে ইমেইলের মাধ্যমে জানিয়ে দেব।