研究/指标——从BizConsult的样本中估计总使用发生率:营销教授问题40684

问题

主题:研究/指标

从样本中估计总使用发生率

发布的BizConsult在美国东部时间2013年1月15日下午4:08 1500点

我试图使用Excel从三个不同大小和%s的(非排他的)样本中估计总独立访问者和总1、2和3+时间用户。然后，在组合它们之后，从所有三个中估计相同的值-示例如下:

组# 1:
总数:30万
样品:30,000
样本量占总数的百分比:10.0%

类似地，第2组和第3组的布局也相同:
组2:
5000(总)
2000(样本)
40.0%(样本%)

第三组:
40000年
10000年
25.0%

总计
345000年
42000年
12.2%

接下来，我使用个人名称来计算每个组中的重复数，得到如下数字:

组1:
暗金物品:24000
一次性样本:20000
双重用途样本:3000
3+使用样本:1000

对其他组使用相同的布局:
组2:
1150(独立)
1000 (1 x)
100 (2 x)
50 (3 + x)

第三组:
7100年
6000年
1000年
One hundred.

跨组相加，提供了一个不正确的“相加总数”，如下所示:

“添加剂”:
32250年
27000年
4100年
1150年

如果我真的把这三组原始的个人名字数据结合起来，我可能会得到真实的、扣除的总数，比如:
30900年
25000年
4400年
1500年

您将注意到，当组合三个不同的组时，由于不同组中存在一些相同的用户，多用途人员的发生率增加了(而不是“相加总数”)。这反过来又减少了一次性使用人员和相对于“相加总数”数字的唯一性。

我指出这一点是因为下一步和最终目标是单独估计每个群体的单一、双重和3+用途:在这里，我不能使用直线数学来得到总数，因为当用户数量增加时，单一和单一用途的人数将减少，而不是线性估计的总数。

举个例子:我不能在第一组样本中选取24000个唯一的人，然后除以10%的样本容量，得到估计的24000个唯一的人，因为如果我们实际上有30万第一组人的完整名册，许多抽样的唯一的人会再次出现;来自完整数据集的真实惟一值可能是180,000或210,000。

类似地，当组合不同组的样本时，我不能将12%的因子应用于组合的总样本unique(30,900)，以得到估计的总数为253,821，因为多用途计数将增加，减少了unique和一次性使用的个体。

所以这是一个很长的，但(希望)说明性的方法，来解决这个问题，“什么Excel公式可以应用于单个样本组，以及组合样本总数，来估计整个数据集的值?”

值得注意的是，我需要比较的不同用户组的样本量可能在10-100%之间变化。底线是，我需要这组组的估计值，以及其他几个不同的组的估计值，这样我就可以比较绝对值，估计值，1、2和3+数。

谢谢你的帮助!

要继续阅读这个问题和解决方案，请注册…它是免费的!

订阅
或者,登录

反应

发布的BizConsult在2013年1月15日下午4:42 作者

MONMARK -如果你自己做作业，你会发现我远远不是一个学生…你完全错了。
发布的SteveByrneMarketing在2013年1月15日晚上7:18 成员

这看起来像一个项目(不仅仅是快速建议)。

这个网站上有一个页面张贴项目信息，这样这里的顾问就可以出价了，但我找不到。版主请帮忙，新网站的项目页面/链接在哪里?
发布的加里纰漏在2013年1月15日晚上7:37 成员

这有用吗?https://www.tushar-mehta.com/publish_train/data_analysis/06.shtml
发布的mgoodman在2013年1月15日晚上8:30 主持人

看起来“雇佣专家”部分消失了。我的猜测是，它不怎么被使用，占据了宝贵的土地。在事情的计划中不是一个巨大的损失，但是现在当我们想要将某人重定向到项目方法时，我们必须建议其他替代方案。
发布的SteveByrneMarketing在2013年1月16日凌晨2:28 成员

谢谢，迈克尔，这正是我所怀疑的，现在证实了。因此，它成为了一些营销策划的机会……解决替代方案的问题…了解下院读者的想法和希望看到的发展。计划，它总是回到好的计划。
发布的mgoodman在2013年1月16日上午8:09 主持人

@Steve和其他人:我有域名MarketingExpertsOnCall.com，但我没有使用它。如果您想用类似的服务替代Hire an Expert，欢迎访问该域名。
发布的SteveByrneMarketing在2013年1月16日下午4:52 成员

凯莉，谢谢你的最新消息。如果我能帮上忙，请告诉我。

迈克尔，很有趣……我得再考虑一下。
发布的BizConsult在2013年1月16日下午5:44 作者

对于任何有兴趣回答这个问题的人，它仍然是开放的!

目前的受访者:

Gary:你是指链接的网站作为一个一般资源(谢谢-不知道这个)，还是有一个特定的部分，你认为是相关的?(登陆页面上有很多内容，我没有确定具体的部分可以直接应用)。

其他人:如果我误解了这个网站的目的和功能，我道歉——我用它来帮助别人和分享想法(…至少直到我们的垃圾邮件过滤器删除了我以前通过电子邮件收到的日常问题……)，但从它的声音来看，许多人似乎更多地将其用作项目生成工具。我不得不承认，对于一个关于Excel公式的问题，一个人认为是学生的家庭作业问题，另一个人却认为是收费的咨询项目，这有点令人费解、有趣和讽刺!
发布的加里纰漏在2013年1月16日晚上7:57 成员

作为一种通用资源。
发布的SteveByrneMarketing在2013年1月16日晚上8:31 成员

Steve Udell (BizConsult)，

就我个人而言，在提供对帖子的快速响应和将其作为基于收费的项目之间没有明确的界限。一般来说，如果我能快速提供有用的信息(在5-15分钟内)，那么我就可以加入。如果我认为它需要更长的时间投资，那么还有其他的考虑因素，例如，我对这个主题了解多少，它是针对小企业还是针对企业巨头，等等。

我相信这里的其他人(包括作为议员的你)会有不同的想法。我希望你能找到你一直在寻找的答案。
贴在1/18/2013下午3:31 接受

完全同意你把一个公式式的问题放在一起，既基本到可以做作业，又复杂到值得做付费项目——非常有趣!由于人们无法或不愿意回答这个问题，我建议把它发布到一个专注于excel的网站上，在那里人们通常会免费回答问题，比如:

www.msofficeforums.com/excel

https://www.mrexcel.com/forum/excel-questions/

www.excelforum.com

https://excelexperts.com/forum

好运！
发布的BizConsult在1/18/2013下午3:56 作者

MktgInfo:

好建议——几分钟前我正在发布一个帖子，昨天就发布了一个!我想也有一些付费网站……

谢谢!
发布的BizConsult在2013年1月23日下午1:40 作者

由于缺乏活动，我假设没有人能够解决这个问题-如果你能解决它，很高兴给你的点!

回到顶部

技术交流:研究/指标

问题

从样本中估计总使用发生率

反应

发表评论

相关讨论

社区信息

25位专家
(研究/指标)

问题

从样本中估计总使用发生率

反应

发表评论

相关讨论

社区信息

25位专家(研究/指标)

25位专家
(研究/指标)