我有超过20K个样本的gwas微阵列实验数据结果。每个样本具有大约1.000.000个标记的数值输出值。所以我有一个20000 x 1000000的理论表。最终目标是创建一个web服务,以便显示少量样本的输出值。我有几十个变量来构建查询。我的问题是如何以一种有效的方式创建这种数据库。对于这么大的数据量,MySQL是最好的选择,还是只依赖于服务器硬件?
提前谢谢。
我正在尝试为我的网站实现一个实时搜索。在给定的字符串中标识单词或单词部分的人。然后,即时结果在与查询匹配的位置加下划线。
例如,查询“油炸绿色西红柿”将产生:
SELECT *
FROM articles
WHERE (title LIKE '%fried%' OR
title LIKE '%green%' OR
title LIKE '%tomatoes%)
这在一个非常小的数据集上工作得很好。但是,一旦数据库中的记录数量增加,这种查询很快就会变得低效,因为它不能利用索引。
我知道从技术上讲,这是MySQL中全文搜索的目