扁桃(Prunus dulcis)是世界范围内广泛种植的重要蔷薇科扁桃亚属经济果树,是世界四大干果之一。扁桃自唐朝开始在中国栽培,至今已有1300多年的历史。中国新疆喀什地区是栽培扁桃植物的主要产区,拥有丰富的扁桃资源,包括‘多果’、‘双软’、‘晚丰’、‘纸皮’、‘鹰嘴’和‘双果’等。过去几年,欧美相关研究机构已对‘Lauranne’、‘Texas’和‘Nonpareil’等3个扁桃品种的基因组进行了均采用二代测序技术进行基因组测序和组装分析,并取得了重要成果。近期,安博网页版园艺学院扁桃研究课题组对中国新疆本土栽培扁桃‘晚丰’品种采用更为先进的第三代测序技术进行染色体水平高质量基因组测序和组装,并将基因组数据公布在中国国家生物信息中心(BioProject ID: PRJNA854307)因此,对中国地方扁桃品种进行基因组测序和组装势在必行。
近日,安博网页版曾斌教授团队在《Scientific Data》发表题为“Chromosome level genome assembly of ‘Wanfeng’almond (Prunus dulcis)”的研究型论文,该研究对‘晚丰’扁桃基因组在染色体水平上进行精确的测序与组装分析,为中国地方扁桃的分子育种提供了宝贵的基因资源。
研究人员利用DNBSEQ-T7平台对‘晚丰’扁桃叶片进行测序,获得了50.29 Gb的二代原始数据。K-mer分析预测‘晚丰’扁桃基因组大小为288.08 Mb,杂合度为0.81 %,重复序列比例为50.98 %(图1,表1)。
随后,通过Pac Bio Sequel Ⅱ测序平台获得Hi Fi(High-Fidelity)数据,组装‘晚丰’扁桃从头基因组,并结合Hi-C测序数据辅助组装,达到染色体水平(图2,表1)。
最终,‘晚丰’扁桃基因组大小为288.53 Mb,contig N50和scaffold N50分别为30.48 Mb和31.36 Mb,约270 Mb的序列锚定在8个Superscaffolds上,在‘晚丰’扁桃基因组中共预测到24230个蛋白编码基因(表2,图3)。此外,还鉴定到225个miRNA、530个tRNA、7669个rRNA和816个snRNA非编码RNA(表3)。
安博网页版园艺学院博士研究生张冬冬为第一作者,园艺学院青年教师余镇藩为共同第一作者,曾斌教授和王力荣教授为该文的共同通讯作者。该研究受到新疆维吾尔自治区自然科学基金项目资助(2023D01A27)。本研究也得到了西部农业研究中心的资助。