data-generation相关内容
我已安装Spacy并使用以下命令下载了en_core_web_sm: PIP安装空间 Python-m空格下载en_core_web_sm 也试过了 PIP3安装https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.2.0/en_core_web_sm-2.2.0.tar.gz 我的Spacy
..
我正在尝试使用 Stream API 生成 Order 实例.我有一个创建订单的工厂函数,一个 DoubleStream 用于初始化订单的金额. private DoubleStream doubleStream = new Random().doubles(50.0, 200.0);私人订单 createOrder() {return new Order(doubleStream.findFi
..
如何根据当前日期返回包含过去四年的行集? 如果这个查询在 12/31/2010 运行,它应该返回: 20072008年2009年2010年 但如果它在 1/1/2011 运行,它应该返回: 20082009年2010年2011年 这是我的开始,两个返回起始年份的查询.我更喜欢第二个,因为转换为字符串对我来说有点脏. SELECT TO_CHAR(TRUNC(sysdate, 'YY
..
..
我正在寻找一个好的免费工具的建议,用于生成样本数据以加载到测试数据库中.以此类推,可以为任何 RDBMS 生成“lorem ipsum"文本.我正在寻找的功能包括: 为现有表定义生成数据的灵活性. 能够生成大小数据集(> 100 万行或更多). 以 SQL 脚本格式(INSERT 语句)或适合批量导入的平面文件格式(通常更快)生成. 易于编写脚本的命令行界面. 可扩展、开源、用动态语
..
我有一个包含 RGB 图像的图像数据集:img1.png、img2.png ... img250.png.我从每个图像中提取了 100 个大小为 [64,64,3] 的小块.所以,我现在有像 img1_1.png, img1_2.png ...img1_100.png, img2_1.png, img2_2.png, ... img2_100.png, img3_1, ..... 我想用 t
..
对于我目前正在上的一门课程,我正在尝试建立虚拟交易,客户与交易;产品数据集,用于展示网店环境中的机器学习用例以及财务仪表板;不幸的是,我们没有得到虚拟数据。我认为这是提高我的R知识的好方法,但是在实现它方面遇到了很大的困难。 我的想法是我指定一些参数/规则(任意/虚拟的,但适用于某种聚类算法的演示)。我基本上是想隐藏一个模式,然后利用机器学习(不是此问题的一部分)重新找到该模式。我隐藏的模式
..
考虑到正则表达式,我想生成随机数据x进行测试的时间。 例如 >>打印generate_date(’\d {2,3}’) 13 >>>打印generate_date('\d {2,3}') 422 当然目的是要做一些比电话号码和电子邮件地址更复杂的事情。 是否存在类似的东西?如果可以,Python是否存在?如果没有,我可以使用任何线索/理论来做到这一点?
..
我有一个包含10万个唯一数据记录的数据集,以对代码进行基准测试,我需要对具有500万个唯一记录的数据进行测试,但我不想生成随机数据。我想使用我拥有的10万条数据记录作为基础数据集,并使用某些列的唯一值生成与之相似的剩余数据,如何使用python或Scala做到这一点? 以下是示例数据 纬度经度步进计数 25.696395 -80.297496 1 1 25.699544 -80.
..
我想收到有关SQL Server可用数据生成器的建议。如果发布回复,请提供您认为重要的任何功能。 我从来没有使用过这样的应用程序,因此我希望受此主题的启发。谢谢。 (我的目标是在每个表中用10,000条以上的记录填充数据库,以测试应用程序。) 解决方案 我已经滚动了自己的数据生成器,该生成器生成符合正则表达式的随机数据。它变成了一个学习项目(正在开发中),可以在 github
..
我正在寻找一个推荐的免费免费工具,用于生成示例数据以加载到测试数据库中。以此类推,可以为任何RDBMS生成“ lorem ipsum “文本。我要寻找的功能包括: 可以灵活地为现有表定义生成数据。 一百万行或更多)的能力。 以SQL脚本格式生成( INSERT 语句),也可以采用适合批量导入的平面文件格式(通常更快)。 用于轻松编写脚本的命令行界面。 可扩展的开放源代码,以动态语言编
..
如何根据当前日期返回由过去四年组成的行集? 如果此查询在2010年12月31日运行,则应返回: 2007 2008 2009 2010 但是如果它在2011年1月1日运行,它应该返回: 2008 2009 2010 2011 这就是我的开始,两个查询返回了起始年份.我更喜欢第二种,因为转换为字符串对我来说有点脏. SELECT TO_CHAR(TRUNC(sysda
..
我想知道Java是否存在伪数据生成器。在Perl中存在 Data :: Faker 并且有一个名为 faker ,适用于JavaScript faker.js 。有人知道Java的伪数据生成器,它可以提供随机名称,电话号码,P.O。盒号等... 解决方案 如果您正在使用Hibernate,请尝试 HibernateMock 。 另外: ThinkUI Benerator
..
是的,你读得对。我需要能够从正则表达式生成随机文本的东西。所以文本应该是随机的,但要与正则表达式匹配。它似乎不存在,但我可能是错的。 只是一个例子:该库能够获取' [ab ] * c '作为输入,并生成如下样本: abc abbbc bac 等。 更新:我自己创造了一些东西:Xeger。查看 http://code.google.com/p/xeger/ 。
..
我正在尝试使用Stream API生成订单实例。我有一个创建订单的工厂函数,DoubleStream用于初始化订单金额。 private DoubleStream doubleStream = new Random()。double(50.0,200.0); private订单createOrder(){ 返回新订单(doubleStream.findFirst()。getAsDo
..