index.js 3.3 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128
  1. var fs = require('fs');
  2. var path = require("path");
  3. var MAX_BYTES = 512;
  4. module.exports = function(bytes, size, cb) {
  5. // Only two args
  6. if (cb === undefined) {
  7. var file = bytes;
  8. cb = size;
  9. fs.stat(file, function(err, stat) {
  10. if (err || !stat.isFile()) return cb(err, false);
  11. fs.open(file, 'r', function(r_err, descriptor){
  12. if (r_err) return cb(r_err);
  13. bytes = new Buffer(MAX_BYTES);
  14. // Read the file with no encoding for raw buffer access.
  15. fs.read(descriptor, bytes, 0, bytes.length, 0, function(err, size, bytes){
  16. fs.close(descriptor, function(c_err){
  17. if (c_err) return cb(c_err, false);
  18. return cb(null, isBinaryCheck(bytes, size));
  19. });
  20. });
  21. });
  22. });
  23. }
  24. else
  25. return cb(null, isBinaryCheck(bytes, size));
  26. };
  27. function isBinaryCheck(bytes, size) {
  28. if (size === 0)
  29. return false;
  30. var suspicious_bytes = 0;
  31. var total_bytes = Math.min(size, MAX_BYTES);
  32. // UTF-8 BOM
  33. if (size >= 3 && bytes[0] == 0xEF && bytes[1] == 0xBB && bytes[2] == 0xBF) {
  34. return false;
  35. }
  36. // UTF-32 BOM
  37. if (size >= 4 && bytes[0] === 0x00 && bytes[1] === 0x00 && bytes[2] == 0xFE && bytes[3] == 0xFF) {
  38. return false;
  39. }
  40. // UTF-32 LE BOM
  41. if (size >= 4 && bytes[0] == 0xFF && bytes[1] == 0xFE && bytes[2] === 0x00 && bytes[3] === 0x00) {
  42. return false;
  43. }
  44. // GB BOM
  45. if (size >= 4 && bytes[0] == 0x84 && bytes[1] == 0x31 && bytes[2] == 0x95 && bytes[3] == 0x33) {
  46. return false;
  47. }
  48. if (total_bytes >= 5 && bytes.slice(0, 5) == "%PDF-") {
  49. /* PDF. This is binary. */
  50. return true;
  51. }
  52. // UTF-16 BE BOM
  53. if (size >= 2 && bytes[0] == 0xFE && bytes[1] == 0xFF) {
  54. return false;
  55. }
  56. // UTF-16 LE BOM
  57. if (size >= 2 && bytes[0] == 0xFF && bytes[1] == 0xFE) {
  58. return false;
  59. }
  60. for (var i = 0; i < total_bytes; i++) {
  61. if (bytes[i] === 0) { // NULL byte--it's binary!
  62. return true;
  63. }
  64. else if ((bytes[i] < 7 || bytes[i] > 14) && (bytes[i] < 32 || bytes[i] > 127)) {
  65. // UTF-8 detection
  66. if (bytes[i] > 193 && bytes[i] < 224 && i + 1 < total_bytes) {
  67. i++;
  68. if (bytes[i] > 127 && bytes[i] < 192) {
  69. continue;
  70. }
  71. }
  72. else if (bytes[i] > 223 && bytes[i] < 240 && i + 2 < total_bytes) {
  73. i++;
  74. if (bytes[i] > 127 && bytes[i] < 192 && bytes[i + 1] > 127 && bytes[i + 1] < 192) {
  75. i++;
  76. continue;
  77. }
  78. }
  79. suspicious_bytes++;
  80. // Read at least 32 bytes before making a decision
  81. if (i > 32 && (suspicious_bytes * 100) / total_bytes > 10) {
  82. return true;
  83. }
  84. }
  85. }
  86. if ((suspicious_bytes * 100) / total_bytes > 10) {
  87. return true;
  88. }
  89. return false;
  90. }
  91. module.exports.sync = function(bytes, size) {
  92. // Only one arg
  93. if (size === undefined) {
  94. var file = bytes;
  95. try {
  96. if(!fs.statSync(file).isFile()) return false;
  97. } catch (err) {
  98. // otherwise continue on
  99. }
  100. var descriptor = fs.openSync(file, 'r');
  101. try {
  102. // Read the file with no encoding for raw buffer access.
  103. bytes = new Buffer(MAX_BYTES);
  104. size = fs.readSync(descriptor, bytes, 0, bytes.length, 0);
  105. } finally {
  106. fs.closeSync(descriptor);
  107. }
  108. return isBinaryCheck(bytes, size);
  109. }
  110. else
  111. return isBinaryCheck(bytes, size);
  112. }