================================================================================ OCTUPLE分词结果统计分析报告 ================================================================================ 总token数: 1,321,324,184 分析的列数: 8 -------------------------------------------------------------------------------- 列 0: pitch -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 152 Token值范围: [1, 154] 平均出现次数: 1086615.28 Top 20 最常见的token: 1. Token 50: 6,756,218 次 ( 4.09%) 2. Token 45: 6,319,724 次 ( 3.83%) 3. Token 52: 6,124,177 次 ( 3.71%) 4. Token 43: 5,553,458 次 ( 3.36%) 5. Token 47: 5,378,723 次 ( 3.26%) 6. Token 48: 5,238,197 次 ( 3.17%) 7. Token 55: 5,193,681 次 ( 3.14%) 8. Token 57: 5,063,741 次 ( 3.07%) 9. Token 38: 4,698,214 次 ( 2.84%) 10. Token 40: 4,524,339 次 ( 2.74%) 11. Token 54: 4,114,700 次 ( 2.49%) 12. Token 53: 3,608,951 次 ( 2.19%) 13. Token 59: 3,596,239 次 ( 2.18%) 14. Token 33: 3,557,109 次 ( 2.15%) 15. Token 42: 3,443,881 次 ( 2.09%) 16. Token 41: 3,389,405 次 ( 2.05%) 17. Token 46: 3,339,383 次 ( 2.02%) 18. Token 49: 3,305,354 次 ( 2.00%) 19. Token 36: 3,291,100 次 ( 1.99%) 20. Token 31: 3,182,789 次 ( 1.93%) Top 20 最不常见的token (出现次数>0): 1. Token 154: 2,893 次 ( 0.00%) 2. Token 100: 3,087 次 ( 0.00%) 3. Token 92: 3,928 次 ( 0.00%) 4. Token 98: 3,947 次 ( 0.00%) 5. Token 153: 5,693 次 ( 0.00%) 6. Token 144: 6,163 次 ( 0.00%) 7. Token 152: 6,992 次 ( 0.00%) 8. Token 124: 7,025 次 ( 0.00%) 9. Token 99: 7,149 次 ( 0.00%) 10. Token 97: 8,181 次 ( 0.00%) 11. Token 95: 8,772 次 ( 0.01%) 12. Token 94: 10,733 次 ( 0.01%) 13. Token 96: 12,211 次 ( 0.01%) 14. Token 90: 14,891 次 ( 0.01%) 15. Token 132: 15,082 次 ( 0.01%) 16. Token 150: 15,272 次 ( 0.01%) 17. Token 145: 16,302 次 ( 0.01%) 18. Token 137: 16,361 次 ( 0.01%) 19. Token 91: 17,313 次 ( 0.01%) 20. Token 4: 22,345 次 ( 0.01%) 分布统计: 最小出现次数: 2,893 最大出现次数: 6,756,218 中位数出现次数: 254,923 标准差: 1,566,812.91 -------------------------------------------------------------------------------- 列 1: position -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 97 Token值范围: [0, 99] 平均出现次数: 1702737.35 Top 20 最常见的token: 1. Token 4: 32,574,271 次 (19.72%) 2. Token 20: 21,155,511 次 (12.81%) 3. Token 12: 18,937,356 次 (11.47%) 4. Token 28: 16,053,301 次 ( 9.72%) 5. Token 16: 12,662,506 次 ( 7.67%) 6. Token 8: 10,194,883 次 ( 6.17%) 7. Token 24: 9,383,102 次 ( 5.68%) 8. Token 32: 9,043,069 次 ( 5.48%) 9. Token 10: 3,268,085 次 ( 1.98%) 10. Token 18: 2,956,264 次 ( 1.79%) 11. Token 26: 2,464,244 次 ( 1.49%) 12. Token 14: 2,308,328 次 ( 1.40%) 13. Token 6: 2,216,672 次 ( 1.34%) 14. Token 34: 2,047,098 次 ( 1.24%) 15. Token 22: 2,020,825 次 ( 1.22%) 16. Token 30: 1,808,841 次 ( 1.10%) 17. Token 44: 1,473,726 次 ( 0.89%) 18. Token 36: 1,430,246 次 ( 0.87%) 19. Token 17: 1,159,945 次 ( 0.70%) 20. Token 9: 1,108,378 次 ( 0.67%) Top 20 最不常见的token (出现次数>0): 1. Token 99: 333 次 ( 0.00%) 2. Token 59: 591 次 ( 0.00%) 3. Token 91: 672 次 ( 0.00%) 4. Token 61: 732 次 ( 0.00%) 5. Token 67: 795 次 ( 0.00%) 6. Token 75: 798 次 ( 0.00%) 7. Token 53: 804 次 ( 0.00%) 8. Token 97: 1,067 次 ( 0.00%) 9. Token 65: 1,075 次 ( 0.00%) 10. Token 69: 1,083 次 ( 0.00%) 11. Token 83: 1,092 次 ( 0.00%) 12. Token 85: 1,152 次 ( 0.00%) 13. Token 77: 1,200 次 ( 0.00%) 14. Token 93: 1,203 次 ( 0.00%) 15. Token 87: 1,206 次 ( 0.00%) 16. Token 81: 1,211 次 ( 0.00%) 17. Token 55: 1,276 次 ( 0.00%) 18. Token 57: 1,288 次 ( 0.00%) 19. Token 71: 1,346 次 ( 0.00%) 20. Token 89: 1,411 次 ( 0.00%) 分布统计: 最小出现次数: 333 最大出现次数: 32,574,271 中位数出现次数: 28,125 标准差: 4,909,414.79 -------------------------------------------------------------------------------- 列 2: bar -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 513 Token值范围: [0, 515] 平均出现次数: 321960.08 Top 20 最常见的token: 1. Token 14: 2,130,472 次 ( 1.29%) 2. Token 10: 2,127,003 次 ( 1.29%) 3. Token 18: 2,125,751 次 ( 1.29%) 4. Token 16: 2,112,689 次 ( 1.28%) 5. Token 17: 2,101,670 次 ( 1.27%) 6. Token 12: 2,077,660 次 ( 1.26%) 7. Token 13: 2,077,279 次 ( 1.26%) 8. Token 15: 2,066,264 次 ( 1.25%) 9. Token 9: 2,055,179 次 ( 1.24%) 10. Token 8: 2,039,302 次 ( 1.23%) 11. Token 11: 2,017,531 次 ( 1.22%) 12. Token 19: 2,013,280 次 ( 1.22%) 13. Token 20: 1,985,896 次 ( 1.20%) 14. Token 22: 1,967,164 次 ( 1.19%) 15. Token 21: 1,952,546 次 ( 1.18%) 16. Token 6: 1,938,737 次 ( 1.17%) 17. Token 24: 1,928,889 次 ( 1.17%) 18. Token 26: 1,925,621 次 ( 1.17%) 19. Token 25: 1,922,850 次 ( 1.16%) 20. Token 23: 1,910,880 次 ( 1.16%) Top 20 最不常见的token (出现次数>0): 1. Token 511: 9,129 次 ( 0.01%) 2. Token 510: 9,162 次 ( 0.01%) 3. Token 507: 9,211 次 ( 0.01%) 4. Token 509: 9,374 次 ( 0.01%) 5. Token 508: 9,407 次 ( 0.01%) 6. Token 513: 9,589 次 ( 0.01%) 7. Token 512: 9,599 次 ( 0.01%) 8. Token 506: 9,651 次 ( 0.01%) 9. Token 515: 9,795 次 ( 0.01%) 10. Token 499: 9,813 次 ( 0.01%) 11. Token 503: 9,818 次 ( 0.01%) 12. Token 514: 9,841 次 ( 0.01%) 13. Token 505: 9,859 次 ( 0.01%) 14. Token 500: 9,869 次 ( 0.01%) 15. Token 498: 9,959 次 ( 0.01%) 16. Token 501: 9,974 次 ( 0.01%) 17. Token 502: 10,061 次 ( 0.01%) 18. Token 504: 10,076 次 ( 0.01%) 19. Token 497: 10,264 次 ( 0.01%) 20. Token 495: 10,297 次 ( 0.01%) 分布统计: 最小出现次数: 9,129 最大出现次数: 2,130,472 中位数出现次数: 58,000 标准差: 542,952.62 -------------------------------------------------------------------------------- 列 3: velocity -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 33 Token值范围: [0, 35] 平均出现次数: 5005015.85 Top 20 最常见的token: 1. Token 23: 81,316,692 次 (49.23%) 2. Token 27: 24,139,232 次 (14.62%) 3. Token 19: 12,080,765 次 ( 7.31%) 4. Token 31: 10,823,520 次 ( 6.55%) 5. Token 16: 10,648,704 次 ( 6.45%) 6. Token 35: 7,024,913 次 ( 4.25%) 7. Token 12: 2,746,364 次 ( 1.66%) 8. Token 28: 1,979,649 次 ( 1.20%) 9. Token 22: 1,770,942 次 ( 1.07%) 10. Token 26: 1,357,064 次 ( 0.82%) 11. Token 25: 1,320,532 次 ( 0.80%) 12. Token 21: 1,224,845 次 ( 0.74%) 13. Token 32: 1,130,883 次 ( 0.68%) 14. Token 18: 1,114,141 次 ( 0.67%) 15. Token 24: 811,770 次 ( 0.49%) 16. Token 20: 788,683 次 ( 0.48%) 17. Token 29: 707,198 次 ( 0.43%) 18. Token 33: 589,593 次 ( 0.36%) 19. Token 30: 584,551 次 ( 0.35%) 20. Token 17: 464,538 次 ( 0.28%) Top 20 最不常见的token (出现次数>0): 1. Token 5: 14,527 次 ( 0.01%) 2. Token 6: 55,253 次 ( 0.03%) 3. Token 9: 97,242 次 ( 0.06%) 4. Token 8: 114,433 次 ( 0.07%) 5. Token 10: 118,225 次 ( 0.07%) 6. Token 4: 127,511 次 ( 0.08%) 7. Token 0: 167,245 次 ( 0.10%) 8. Token 11: 189,100 次 ( 0.11%) 9. Token 34: 233,771 次 ( 0.14%) 10. Token 14: 275,035 次 ( 0.17%) 11. Token 13: 342,243 次 ( 0.21%) 12. Token 15: 348,278 次 ( 0.21%) 13. Token 7: 458,081 次 ( 0.28%) 14. Token 17: 464,538 次 ( 0.28%) 15. Token 30: 584,551 次 ( 0.35%) 16. Token 33: 589,593 次 ( 0.36%) 17. Token 29: 707,198 次 ( 0.43%) 18. Token 20: 788,683 次 ( 0.48%) 19. Token 24: 811,770 次 ( 0.49%) 20. Token 18: 1,114,141 次 ( 0.67%) 分布统计: 最小出现次数: 14,527 最大出现次数: 81,316,692 中位数出现次数: 707,198 标准差: 14,375,775.97 -------------------------------------------------------------------------------- 列 4: duration -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 65 Token值范围: [0, 67] 平均出现次数: 2541008.05 Top 20 最常见的token: 1. Token 7: 53,760,996 次 (32.55%) 2. Token 11: 34,836,051 次 (21.09%) 3. Token 5: 29,539,137 次 (17.88%) 4. Token 4: 12,488,095 次 ( 7.56%) 5. Token 19: 6,828,131 次 ( 4.13%) 6. Token 6: 5,468,321 次 ( 3.31%) 7. Token 9: 3,217,846 次 ( 1.95%) 8. Token 15: 2,890,926 次 ( 1.75%) 9. Token 18: 2,575,465 次 ( 1.56%) 10. Token 35: 2,528,635 次 ( 1.53%) 11. Token 27: 2,218,271 次 ( 1.34%) 12. Token 8: 1,974,671 次 ( 1.20%) 13. Token 14: 1,237,364 次 ( 0.75%) 14. Token 33: 1,055,556 次 ( 0.64%) 15. Token 26: 825,830 次 ( 0.50%) 16. Token 43: 470,949 次 ( 0.29%) 17. Token 23: 368,145 次 ( 0.22%) 18. Token 51: 313,819 次 ( 0.19%) 19. Token 22: 200,891 次 ( 0.12%) 20. Token 67: 187,607 次 ( 0.11%) Top 20 最不常见的token (出现次数>0): 1. Token 56: 250 次 ( 0.00%) 2. Token 60: 296 次 ( 0.00%) 3. Token 62: 308 次 ( 0.00%) 4. Token 64: 408 次 ( 0.00%) 5. Token 58: 723 次 ( 0.00%) 6. Token 54: 1,120 次 ( 0.00%) 7. Token 66: 1,852 次 ( 0.00%) 8. Token 52: 2,792 次 ( 0.00%) 9. Token 61: 2,857 次 ( 0.00%) 10. Token 48: 4,437 次 ( 0.00%) 11. Token 57: 5,302 次 ( 0.00%) 12. Token 63: 6,889 次 ( 0.00%) 13. Token 44: 7,677 次 ( 0.00%) 14. Token 40: 8,736 次 ( 0.01%) 15. Token 28: 11,415 次 ( 0.01%) 16. Token 32: 13,414 次 ( 0.01%) 17. Token 49: 13,944 次 ( 0.01%) 18. Token 53: 17,193 次 ( 0.01%) 19. Token 59: 17,534 次 ( 0.01%) 20. Token 29: 17,636 次 ( 0.01%) 分布统计: 最小出现次数: 250 最大出现次数: 53,760,996 中位数出现次数: 69,089 标准差: 8,623,586.00 -------------------------------------------------------------------------------- 列 5: program -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 130 Token值范围: [0, 132] 平均出现次数: 1270504.02 Top 20 最常见的token: 1. Token 4: 59,258,093 次 (35.88%) 2. Token 132: 15,564,529 次 ( 9.42%) 3. Token 44: 6,045,327 次 ( 3.66%) 4. Token 56: 5,504,350 次 ( 3.33%) 5. Token 75: 5,461,270 次 ( 3.31%) 6. Token 77: 5,424,393 次 ( 3.28%) 7. Token 60: 5,225,132 次 ( 3.16%) 8. Token 52: 4,570,089 次 ( 2.77%) 9. Token 61: 4,263,879 次 ( 2.58%) 10. Token 28: 3,301,108 次 ( 2.00%) 11. Token 69: 3,287,914 次 ( 1.99%) 12. Token 46: 3,275,859 次 ( 1.98%) 13. Token 64: 3,238,555 次 ( 1.96%) 14. Token 62: 3,233,651 次 ( 1.96%) 15. Token 70: 2,257,240 次 ( 1.37%) 16. Token 45: 2,209,485 次 ( 1.34%) 17. Token 72: 2,064,103 次 ( 1.25%) 18. Token 16: 1,907,690 次 ( 1.16%) 19. Token 29: 1,745,633 次 ( 1.06%) 20. Token 74: 1,606,358 次 ( 0.97%) Top 20 最不常见的token (出现次数>0): 1. Token 129: 379 次 ( 0.00%) 2. Token 124: 650 次 ( 0.00%) 3. Token 127: 703 次 ( 0.00%) 4. Token 128: 1,004 次 ( 0.00%) 5. Token 130: 1,374 次 ( 0.00%) 6. Token 123: 2,449 次 ( 0.00%) 7. Token 117: 2,620 次 ( 0.00%) 8. Token 125: 4,107 次 ( 0.00%) 9. Token 90: 4,509 次 ( 0.00%) 10. Token 131: 4,577 次 ( 0.00%) 11. Token 105: 5,155 次 ( 0.00%) 12. Token 126: 5,253 次 ( 0.00%) 13. Token 115: 6,629 次 ( 0.00%) 14. Token 80: 6,675 次 ( 0.00%) 15. Token 101: 7,964 次 ( 0.00%) 16. Token 119: 8,118 次 ( 0.00%) 17. Token 87: 9,526 次 ( 0.01%) 18. Token 122: 11,770 次 ( 0.01%) 19. Token 99: 11,962 次 ( 0.01%) 20. Token 81: 12,382 次 ( 0.01%) 分布统计: 最小出现次数: 379 最大出现次数: 59,258,093 中位数出现次数: 101,767 标准差: 5,429,735.91 -------------------------------------------------------------------------------- 列 6: tempo -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 33 Token值范围: [0, 35] 平均出现次数: 5005015.85 Top 20 最常见的token: 1. Token 16: 45,114,808 次 (27.31%) 2. Token 13: 8,972,232 次 ( 5.43%) 3. Token 10: 8,859,942 次 ( 5.36%) 4. Token 11: 8,326,936 次 ( 5.04%) 5. Token 17: 7,387,116 次 ( 4.47%) 6. Token 19: 6,942,952 次 ( 4.20%) 7. Token 14: 6,860,103 次 ( 4.15%) 8. Token 22: 6,648,928 次 ( 4.03%) 9. Token 9: 5,790,437 次 ( 3.51%) 10. Token 12: 5,732,199 次 ( 3.47%) 11. Token 20: 5,542,314 次 ( 3.36%) 12. Token 18: 5,464,663 次 ( 3.31%) 13. Token 15: 5,131,246 次 ( 3.11%) 14. Token 8: 4,962,026 次 ( 3.00%) 15. Token 25: 4,957,658 次 ( 3.00%) 16. Token 7: 4,177,507 次 ( 2.53%) 17. Token 23: 3,797,354 次 ( 2.30%) 18. Token 21: 2,939,811 次 ( 1.78%) 19. Token 28: 2,637,904 次 ( 1.60%) 20. Token 26: 2,222,934 次 ( 1.35%) Top 20 最不常见的token (出现次数>0): 1. Token 33: 113,885 次 ( 0.07%) 2. Token 0: 167,245 次 ( 0.10%) 3. Token 32: 356,430 次 ( 0.22%) 4. Token 30: 471,799 次 ( 0.29%) 5. Token 5: 609,770 次 ( 0.37%) 6. Token 27: 776,090 次 ( 0.47%) 7. Token 29: 920,327 次 ( 0.56%) 8. Token 31: 941,730 次 ( 0.57%) 9. Token 34: 1,214,421 次 ( 0.74%) 10. Token 4: 1,457,184 次 ( 0.88%) 11. Token 24: 1,696,832 次 ( 1.03%) 12. Token 35: 1,923,315 次 ( 1.16%) 13. Token 6: 2,047,425 次 ( 1.24%) 14. Token 26: 2,222,934 次 ( 1.35%) 15. Token 28: 2,637,904 次 ( 1.60%) 16. Token 21: 2,939,811 次 ( 1.78%) 17. Token 23: 3,797,354 次 ( 2.30%) 18. Token 7: 4,177,507 次 ( 2.53%) 19. Token 25: 4,957,658 次 ( 3.00%) 20. Token 8: 4,962,026 次 ( 3.00%) 分布统计: 最小出现次数: 113,885 最大出现次数: 45,114,808 中位数出现次数: 3,797,354 标准差: 7,594,751.74 -------------------------------------------------------------------------------- 列 7: timesig -------------------------------------------------------------------------------- 总token数: 165,165,523 唯一token数: 10 Token值范围: [0, 12] 平均出现次数: 16516552.30 Top 20 最常见的token: 1. Token 12: 122,569,379 次 (74.21%) 2. Token 9: 16,198,618 次 ( 9.81%) 3. Token 10: 9,427,532 次 ( 5.71%) 4. Token 6: 8,281,749 次 ( 5.01%) 5. Token 5: 3,323,190 次 ( 2.01%) 6. Token 8: 1,649,967 次 ( 1.00%) 7. Token 7: 1,546,501 次 ( 0.94%) 8. Token 4: 1,254,214 次 ( 0.76%) 9. Token 11: 747,128 次 ( 0.45%) 10. Token 0: 167,245 次 ( 0.10%) Top 20 最不常见的token (出现次数>0): 1. Token 0: 167,245 次 ( 0.10%) 2. Token 11: 747,128 次 ( 0.45%) 3. Token 4: 1,254,214 次 ( 0.76%) 4. Token 7: 1,546,501 次 ( 0.94%) 5. Token 8: 1,649,967 次 ( 1.00%) 6. Token 5: 3,323,190 次 ( 2.01%) 7. Token 6: 8,281,749 次 ( 5.01%) 8. Token 10: 9,427,532 次 ( 5.71%) 9. Token 9: 16,198,618 次 ( 9.81%) 10. Token 12: 122,569,379 次 (74.21%) 分布统计: 最小出现次数: 167,245 最大出现次数: 122,569,379 中位数出现次数: 2,486,578 标准差: 35,683,981.69 ================================================================================ 跨列分析 ================================================================================ pitch : 165,165,523 tokens (12.50%) position : 165,165,523 tokens (12.50%) bar : 165,165,523 tokens (12.50%) velocity : 165,165,523 tokens (12.50%) duration : 165,165,523 tokens (12.50%) program : 165,165,523 tokens (12.50%) tempo : 165,165,523 tokens (12.50%) timesig : 165,165,523 tokens (12.50%) ================================================================================ 报告生成完成 ================================================================================