
R语言读取大数据表格中有条件的子集
假设我在R的运行环境下已经读取了一个很大的数据表格x,大概格式是ABCD23442245............67323456我想要提取这个大表格中的一个子集a,条件是...
假设我在R的运行环境下已经读取了一个很大的数据表格x,大概格式是
A B C D
23 44 22 45
... ... ... ...
67 32 34 56
我想要提取这个大表格中的一个子集a,条件是A>30,并且D>50,要求生成的子集格式上与原表格一直应该怎样用R编程。据我了解应该是用”[]“的某些东西,尽量不用循环。希望大神给予帮助!不胜感激! 展开
A B C D
23 44 22 45
... ... ... ...
67 32 34 56
我想要提取这个大表格中的一个子集a,条件是A>30,并且D>50,要求生成的子集格式上与原表格一直应该怎样用R编程。据我了解应该是用”[]“的某些东西,尽量不用循环。希望大神给予帮助!不胜感激! 展开
1个回答
展开全部
不知道你说的大表格有多大,但只要能加载到R语言的内存中运算就可以计算。使用subset函数
假设数据集为x
a <- subset(x,A>30)
a <- subset(a,D>50)
subset第一个参数是要筛选的数据集,第二个就是条件,像你说的问题,在第一步过滤的基础上再过滤一次就行,也可以合并到一起。

2023-08-15 广告
通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件...
点击进入详情页
本回答由光点科技提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |