博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《数据科学:R语言实战》一1.4 问题
阅读量:6911 次
发布时间:2019-06-27

本文共 456 字,大约阅读时间需要 1 分钟。

本节书摘来自异步社区《数据科学:R语言实战》一书中的第1章,第1.4节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看

1.4 问题

实际问题

  • 如何决定是否使用K-means或K-medoids?
  • 设计箱线图的意义是什么?为什么那样设计?
  • 对于密度图,请描述生成于iris数据异常值中的底层数据。
  • 对于市场数据集中的其他项目,有哪些抽取规则?

什么时候做、怎样做以及为什么这样做?

  • 未审查在特定领域检测的异常值存在哪些风险?难道不该一直进行计算吗?
  • 为什么需要将iris分类栏排除在异常值检测算法以外?确定异常值时能在某些-
    方面使用iris分类栏吗?
  • 您设想过生成的购物篮数据和规则并不适用于您工作的商店吗?
    挑战
  • 通过使用随机数据,在出现同一示例的两个维度中开发异常值的测试数据十分困难。您能开发出一个测试在至少两个维度中总是出现异常值并且这些维度出现在同一示例中吗?
  • 网络上有一个关于“泰坦尼克号”游轮乘客个人信息数据的数据集,生成有关可能生还乘客的规则。

转载地址:http://vqwcl.baihongyu.com/

你可能感兴趣的文章
Eclipse 使用小结
查看>>
【MVC 4】6.SportsSore:导航
查看>>
ArcEngine的ToolbarControl解析
查看>>
怎样学习使用libiconv库
查看>>
【Little Demo】左右按钮tab选项卡双切换
查看>>
linux下c程序调用reboot函数实现直接重启【转】
查看>>
Visualbox中linux的网络配置
查看>>
谈谈一些有趣的CSS题目(一)-- 左边竖条的实现方法
查看>>
EhCache 分布式缓存/缓存集群
查看>>
偶遇with ties
查看>>
NetFlow是一种数据交换方式,提供网络流量的会话级视图,记录下每个TCP/IP事务的信息...
查看>>
手机网页Html代码实现(解决显示页面很小的问题)
查看>>
指针与储物箱的关系
查看>>
sqlserver 的事务和c#的事务
查看>>
kernelchina.org内核研究
查看>>
模拟Asp.Net Forums实现可以换皮肤的控件 (转载)
查看>>
python使用(一)
查看>>
认真分析mmap:是什么 为什么 怎么用【转】
查看>>
ios 上拉载入下拉刷新Dome
查看>>
Objective-C:NSMutableString类的常见操作
查看>>