2022.9.2 星期五
我发现我对编程还是挺感兴趣的,看来我是被农学耽误的编程大佬,哈哈哈哈哈,怎么说呢,解决问题的过程比想象中要好的多,看文献总是走神的我,在做这些事情的时候要好很多,看来学习生信可以直接取代我的游戏了,虽然比之前更辛苦了但是还是挺快乐的,今天又碰到几个bug,不过都给我解决了,今天也get到几个小知识,下载Python模块可以直接在R的终端来操作,很方便不用再调到cmd里面,其次python中rc模块可以通过安装openpyxl扩展库来解决,说实话我在CSDN里面翻了半个小时,才让我找到合适的方法,(可以参考"重剑无峰_"的第一个博文)不得不说CSDN查找有用消息,还是没达到我的预期,等我英语水平上来了,就要去别的金库去挖宝了,哈哈哈哈哈哈。
今日份代码
批处理:迭代与推导式
R语言的原子数据类型是向量。
Python 语言的原子数据类型是标量。
s = 'ATCGACTG'
len(s) #求长度
列表
seq_list = ['ATCGACTG', 'ATCTG','ATCGACTGATCG','ATATCGATCGCGACTG']
循环
seq_len = []
for s in seq_list:
if len(s) > 5:
seq_len.append(len(s))
print(seq_len) #筛选列表中元素
列表推导式 相当于循环简写
[len(s) for s in seq_list len(s)>5]
字典的推导式
seq_list = ['ATCG', 'ATCGATCG',
'ATCGATCGATCG', 'ATCGATCGATCGATCG',
'ATCGATCGATCGATCGATCG']
seq_dict = {
'chr1':'ATCG',
'chr2':'ATCGATCG',
'chr3':'ATCGATCGATCG',
'chr4':'ATCGATCGATCGATCG',
chr5':'ATCGATCGATCGATCGATCG'
}
循环
seq_len = {}
for k,v in seq_dict.items():
if len(v) > 5 :
seq_len[k]=len(v)
print(seq_len)
字典推导式
{k:len(v) for k,v in seq_dict.items() if len(v)>5}
总结
总的来说,Python相对于R语言,其对元素的筛选还是有所不足,毕竟前者原子数据类型是标量,后者则是向量,对于标量的筛选,默认一次只筛选一个,所以经常会使用到循环,后者则不然,直接,默认对向量内所有元素进行操作,所以只需要一个命令即可。Python为了弥补循环带来的繁琐,所以出现了迭代与推导式,这在其它语言里面是不存在的,相对于其它语言来说还是有所创新的,值得点赞。当然上述操作并不是最简单的模式,还有正则表达式可用。明天再来聊聊正则表达式的应用。加油!!